7 月 2025 - 第52页共230页

超越Claude 3.5和o1！8B模型靠「分层投票+测试时训练」逆袭

2025年7月22日16时作者新智元

MIT研究者发现，测试时训练方法能帮助大模型提升复杂推理问题的准确率。该方法将单个未标记的测试实例转化为自监督学习问题，在对测试样本进行预测之前更新模型参数。

2025年7月22日16时作者机器之心

其复杂的动力学、欠驱动和多样化的任务需求，实现高效的人形机器人全身控制 (Whole-Body Co

2025年7月22日16时作者新智元

Windsurf被谷歌和Cognition分别收购一部分，创始人跑路。此事件引起硅谷VC大佬不满，认为该模式将对初创公司生态系统造成负面影响。

2025年7月22日16时作者机器之心

谷歌 DeepMind 新一代 Gemini 模型在 IMO 竞赛中解决五道高难度数学题，获得 35 分满分 42 分的金牌成绩，并证明 AI 可以通过自然语言理解攻克复杂难题。

2025年7月22日16时作者 AI寒武纪

布的构建Agent经验教训文一起食用更佳
一句话概括：Moonshot 团队用 1 万亿+ 参数稀疏

2025年7月22日16时作者机器之心

，难度也在不断增加，所需的数据更是海量。
大型语言模型（LLM）主要依赖大量文本数据，视觉语言模型（

2025年7月22日14时作者老刘说NLP

2025年7月22日，北京晴。文章介绍了《DeepWriter》的工作思路和设计方法，包括分层知识表示、结构化写作流程、多模态内容融合以及细粒度引用等关键点，并详细讨论了离线知识库构建与在线写作流程中的核心技术。

2025年7月22日14时作者老刘说NLP

度的结合，并且从用户的角度出发去解决问题，这个
受欢迎的概率以及成立性
会高一些。
而在众多方向当中