老刘
具身智能领域代表大模型及医疗多模态数据合成思路
2023年12月27日《Qwen2.5和RoboBrain 2.0在医疗领域与具身智能中的应用》介绍了Qwen2.5用于医疗领域的空间理解模型MedEvalKit以及RoboBrain 2.0 32B用于室内场景建模,强调了它们如何结合医学图像数据进行训练,并生成结构化的3D布局。
搭建智能体6步指南及AI搜索Agent典型实现范式
今天是2025年7月14日,星期一,北京晴。文章介绍了LangChain发布的智能体6步构建指南和AI搜索Agent典型实现范式,强调明确任务、编写SOP、接入真实数据并迭代测试的重要性,并描述了多智能体系统的步骤,包括分解任务、生成DAG、动态规划、执行子任务及合成答案等关键环节。
经典问题之Graph可以如何与Agent结合?从单点到全面归纳
今天是2025年7月12日,星期六,北京,雨。Graph和Agent的结合是社区的重要方向之一。文章回顾了Graph与Agent结合的相关技术进展,包括使用图数据库提升代理记忆管理、优化多Agent协调以及实现基于知识图谱的任务规划与执行等方向。
复杂Agent工具调用、AgenticRAG场景的数据合成问题及代表思路
今天是2025年7月13日,星期日,北京晴。文章讨论了大模型工具调用数据合成的问题,介绍了ACEBench的合成思路和面向RAG场景的TaskCraft工具生成代理任务及其执行轨迹。
再看文档古籍修复前沿方案:定位、预测、图像重建三阶段融合思路
2025年7月11日,北京晴。文章介绍了文档智能在历史文献修复中的应用,包括数据合成和三阶段模型(OCR辅助的损坏定位、损坏内容预测、历史外观恢复)。AutoHDR-Qwen2-1.5B等开源项目展示了这种方法的效果。
文档解析类数据合成工具:7个可用的OCR及文档版式、表格数据开源项目
今天回顾了文档版式及表格数据合成的相关工具和技术。其中包括7个OCR合成数据工具和2种文档版式及表格数据合成工具。这些技术将在实际工作中应用,助力提升效率。老刘也分享了自己的开源项目及其心得。
SIGIR 2025 LiveRAG竞赛获奖方案及中文文档版式分析的标签设计
2025年7月7日星期一北京晴,小暑注意防暑。文档智能进展包括版式分析标签问题和RAG竞赛方案;现有中文文档版式分析的标签体系主要有360layoutanalysis、doclayout和PP-DocLayout;SIGIR 2025 LiveRAG竞赛有多个获奖方案介绍,如TopClustRAG、RMIT–ADM+S等。
6个无代码LLM、Agent、RAG开源工具及推理大模型用于时间序列预测工作
今天是2025年7月6日,星期日,北京晴天。文章介绍了六个无代码LLM、Agent和RAG开源工具,并探讨了使用推理大模型进行时间序列预测的方法及其奖励函数设计。