老刘说NLP，作者每时AI

18个Deepresearch项目技术实现对比及RAG与Reasoning结合范式

2025年7月15日14时作者老刘说NLP

2025年7月15日文章概述：探讨RAG与Reasoning结合的必要性和实现方案，并对比分析了18个DeepResearch项目的技术细节。

2025年7月14日14时作者老刘说NLP

今天是2025年7月14日，星期一，北京晴。文章介绍了LangChain发布的智能体6步构建指南和AI搜索Agent典型实现范式，强调明确任务、编写SOP、接入真实数据并迭代测试的重要性，并描述了多智能体系统的步骤，包括分解任务、生成DAG、动态规划、执行子任务及合成答案等关键环节。

2025年7月14日14时作者老刘说NLP

老刘说NLP技术社区致力于大模型、RAG、文档智能和知识图谱的技术分享，通过早报、专题分享等多种形式促进学习与交流。

2025年7月13日14时作者老刘说NLP

今天是2025年7月12日，星期六，北京，雨。Graph和Agent的结合是社区的重要方向之一。文章回顾了Graph与Agent结合的相关技术进展，包括使用图数据库提升代理记忆管理、优化多Agent协调以及实现基于知识图谱的任务规划与执行等方向。

2025年7月13日14时作者老刘说NLP

今天是2025年7月13日，星期日，北京晴。文章讨论了大模型工具调用数据合成的问题，介绍了ACEBench的合成思路和面向RAG场景的TaskCraft工具生成代理任务及其执行轨迹。

2025年7月12日19时作者老刘说NLP

今天是2025年7月12日，星期六，北京有雨。文章介绍了四个代表性大模型训练框架，并使用资源计算器分析了最新万亿参数模型Kimi-K2的运行和微调需求。

2025年7月11日19时作者老刘说NLP

2025年7月11日，北京晴。文章介绍了文档智能在历史文献修复中的应用，包括数据合成和三阶段模型（OCR辅助的损坏定位、损坏内容预测、历史外观恢复）。AutoHDR-Qwen2-1.5B等开源项目展示了这种方法的效果。

2025年7月11日14时作者老刘说NLP

近期开源了4个大模型：SmolLM3小模型、T5Gemma模型、NextCoder-32B模型和DeepSeek-TNG-R1T2-Chimera专家组合模型，文章介绍了这些模型的特点及模型合并方案，并推荐MergeKit库来执行模型合并。

2025年7月9日14时作者老刘说NLP

2025年7月9日，北京晴天。文章总结了SIGIR 2025 LiveRAG竞赛的评测报告，并介绍了信息抽取和多模态大模型训练的相关方案。强调在轮子同质化背景下，业务know-how的重要性，指出文档解析、RAG及大模型应用出现同质化严重现象。同时提到了两个大模型训练指引资源。

2025年7月8日14时作者老刘说NLP

今天回顾了文档版式及表格数据合成的相关工具和技术。其中包括7个OCR合成数据工具和2种文档版式及表格数据合成工具。这些技术将在实际工作中应用，助力提升效率。老刘也分享了自己的开源项目及其心得。