机器之心
百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板
WriteHERE 通过异质递归规划技术实现单次生成超4万字、100页专业报告的能力,超越现有顶尖方案。其核心突破包括异质任务递归分解和状态化层次调度算法,已在小说创作和报告生成中展示优越性,并公开了包含超过80个子任务的百页报告生成项目。
RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起
微软副总裁 Nando de Freitas 提出 AI 是一场系统性工程的观点,反对单一技术的过度宣传。他认为AI的进步需要成千上万人的共同努力,并强调了多元参与和技术探索的重要性。
用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析
本文介绍了一篇关于任务向量在模型编辑中的有效性和可靠性的论文,并提出了理论分析框架,该研究解决了任务向量方法的应用局限性。
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
本文介绍了一种新的强化学习框架Search-R1,用于训练大语言模型以更有效地利用搜索引擎。通过引入可交互的搜索引擎模块,模型能够在生成答案时随时发起搜索请求,从而提升推理质量。
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
了?大语言模型(LLM)推理需要强化学习(RL)来「加 buff」。
著名 AI 研究者和博主 Se
合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
上海人工智能实验室开源生成式世界模型AETHER,首次实现大模型在真实世界中的3D空间决策与规划能力。通过「重建-预测-规划」一体化框架和几何空间建模,大幅提升模型空间推理的准确性与一致性,并成功实现在合成数据上零样本泛化至真实场景。