月之暗面发布了 Kimi-Researcher,这是一个擅长多轮搜索和推理的 AI Agent(简单理解:适合写论文和报告)。官方数据每个任务重平均会进行 23 步推理,并探索超过 200 个 URL,最强的点是——它在 Humanity’s Last Exam 上取得了 26.9%的 Pass@1 分数,与 Gemini Deep Research 一样的分数,超越所有大模型,作为对比,目前最强大模型 Gemini-2.5-Pro 只有21.6分。
从技术报告来看,主要使用的技术亮点如下:
-
整体学习:不是分别训练各个模块,而是让单一模型整体学习规划、感知和工具使用 -
自主探索:对于每个查询,智能体会探索大量可能的策略,从正确解决方案中获得奖励 -
动态适应:能够自然地处理长期推理任务,并适应不断变化的工具和环境

参考文献:
[1] 技术报告:https://moonshotai.github.io/Kimi-Researcher/
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)