老刘说NLP，作者每时AI

Agent性能优化技术总结及DeeResearch用于Github项目搜索实现思路

2025年4月3日14时作者老刘说NLP

智谱AutoGLM沉思，都引起了大家的关注。
这其实引出来一个观点，关于Agent研发重心。文章(h

R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案

2025年4月2日14时作者老刘说NLP

2025年4月1日，北京天气晴。文章介绍了R1进展中的两个工作，一是研究多种基础模型预训练特性的影响；二是将GRPO-RL强化用于Agent的UI动作预测，数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力，但模板会破坏数学解题能力。此外，文章还讨论了强化学习在图形用户界面（GUI）动作预测中的应用。

大模型黑盒探秘：通过“电路追踪”（Circuit Tracing）揭示大模型内部推理机制？

2025年3月29日14时作者老刘说NLP

2025年3月29日周六，北京晴天。文章提到了创业的观点和MCP的概念，并介绍了大模型推理可解释性的电路追踪分析方法及其应用实验。通过类比神经回路来揭示语言模型内部的计算机制，研究者构建了归因图以可视化模型的中间步骤，发现大模型在处理各种任务时具有多步推理、规划及复用不同语言特征的能力。

Agent&RAG＆KG＆LLM＆文档智能5大技术前沿：老刘说NLP技术社区持续对外纳新

2025年3月29日14时作者老刘说NLP

老刘说NLP技术社区通过每日早报、不定期分享和专题讨论等方式介绍大模型、知识图谱、RAG等多个领域内容，目前已有39次线上交流活动。社区成员可以享受前沿文章推送、技术答疑等权益。

Multi-Agent多智能体为什么会失效？R1类推理模型训练及推理的2个有趣实验结论

2025年3月27日14时作者老刘说NLP

今日讨论了R1推理模型及多智能体相关实验，涵盖思考后再思考提升效果、训练数据长度的重要性以及多智能体系统失效机制三方面内容。

视觉多模态RAG技术总结及Vision-R1用于目标检测任务的奖励函数设计

2025年3月26日14时作者老刘说NLP

2025年3月26日，北京天气阴。文章讨论了多模态RAG技术在视觉领域和目标检测中的应用，并介绍了GPT-4发布的新功能及OpenAI承认的技术风险。同时，文章还提到了Vision-R1方案及其强化学习奖励函数设计。

也看基于版式分析的PDF文档翻译项目及文档版式分析模型PP-DocLayout

2025年3月25日14时作者老刘说NLP

今天是2025年3月25日，星期二。文章介绍了两个文档相关的项目，一个是基于版式分析的PDF文档翻译项目Fast_pdf_trans和PDFMathTranslate，另一个是文档版式分析模型PP-DocLayout。PP-DocLayout能够检测多种类型的文档，并且其三种不同比例的模型在处理复杂布局方面表现良好。而PDFMathTranslate则使用Pdfminer.six等库解析PDF文档，保留了排版信息进行翻译。

RAG＆KG＆LLM＆文档智能技术前沿：老刘说NLP技术社区持续对外纳新

2025年3月25日14时作者老刘说NLP

老刘说NLP技术社区致力于通过早报、在线交流报告和专题分享等方式，围绕大模型、RAG、文档智能和知识图谱等主题，推动技术创新与交流。

也谈Agent的记忆问题及Dify的知识库分段及召回逻辑细节

2025年3月24日14时作者老刘说NLP

案例出发，看看Dify的知识库分段及召回逻辑设计，这个比看论文要踏实的多。
抓住根本问题，做根因，专

从MetaGPT、LangGraph看Agent记忆实现机制：兼看昨日大模型等技术进展回顾

2025年3月24日14时作者老刘说NLP

，从MetaGPT、LangGraph看Agent记忆实现机制，以加强昨日关于Agent机记忆体的认

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31