大语言模型归档 - 第5页共24页

强化学习之父：LLM主导只是暂时，扩展计算才是正解

2025年6月10日11时作者量子位

新晋图灵奖得主Richard Sutton预测大模型主导是暂时的，未来五年甚至十年内AI和强化学习将转向通过Agent与世界的第一人称交互获取‘体验数据’的学习。他强调AI需要新的数据来源，并且要随着增强而改进。他认为真正的突破还是来自规模计算。

2025年6月7日11时作者硅星人Pro

着互联网文本数据被大规模消耗，基于数字世界训练的AI模型性能提升速度明显放缓。与此同时，物理世界中蕴

2025年6月6日14时作者小兵的AI视界

微软推出的Playwright MCP项目通过MCP协议实现了大模型与浏览器自动化交互。支持多种主流浏览器，并提供丰富的交互功能，如点击、拖动、输入文本等，广泛适用于自动化测试、网页自动化操作以及与大语言模型集成等多种场景。

2025年6月5日23时作者 PaperWeekly

“决策”，特别是对于普通人来说两难的决定——比如选哪个病人先抢救、种哪种水果最赚钱、买哪只股票更稳妥

2025年6月5日8时作者机器之心

本文提出了一种全新的隐式知识提取攻击IKEA方法，通过自然、常规查询引导RAG系统暴露其内部知识库中的私有信息，实验证明其具有高效率和成功率。

2025年5月31日8时作者 NLP工程化

一站式资源宝库介绍Awesome-LLM-Post-training，涵盖前沿论文、代码实现及应用案例

2025年5月30日16时作者新智元

体解决科研问题和场景落地的瓶颈。来自英国格拉斯哥大学的研究团队发布了全球首个AI智能体自进化开源框架

2025年5月29日16时作者机器之心

本文提出ZeroSearch框架，无需真实搜索引擎即可激活大语言模型搜索能力。通过轻量级监督微调将LM转为检索模块，并采用课程学习逐步降低文档质量来激发推理能力，显著降低训练成本和提高性能。

2025年5月29日16时作者机器之心

于各个专业领域和日常生活的方方面面。
图 1：需要借助「脑补」图像进行思考的真实世界任务。这些任务通