月之暗面发布了 Kimi-Researcher

月之暗面发布了 Kimi-Researcher，这是一个擅长多轮搜索和推理的 AI Agent（简单理解：适合写论文和报告）。官方数据每个任务重平均会进行 23 步推理，并探索超过 200 个 URL，最强的点是——它在 Humanity’s Last Exam 上取得了 26.9%的 Pass@1 分数，与 Gemini Deep Research 一样的分数，超越所有大模型，作为对比，目前最强大模型 Gemini-2.5-Pro 只有21.6分。

从技术报告来看，主要使用的技术亮点如下：

整体学习：不是分别训练各个模块，而是让单一模型整体学习规划、感知和工具使用
自主探索：对于每个查询，智能体会探索大量可能的策略，从正确解决方案中获得奖励
动态适应：能够自然地处理长期推理任务，并适应不断变化的工具和环境

参考文献：
[1] 技术报告：https://moonshotai.github.io/Kimi-Researcher/

知识星球服务内容：Dify源码剖析及答疑，Dify对话系统源码，NLP电子书籍报告下载，公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。

（文：NLP工程化）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

发表评论 取消回复

发表评论取消回复