8 月 2025 - 第30页共40页

OpenAI IMO金牌团队爆料：AI拒绝作答第六题

2025年8月3日16时作者机器之心

OpenAI团队通过三个核心开发者在IMO竞赛中使用模型赢得了金牌。该项目仅用两三个月时间完成，涉及数学证明风格独特、难以读懂的AI生成问题解答。

告别复杂提示词！蚂蚁新方式让AI自动理解你的个性化需求

2025年8月3日16时作者量子位

蚂蚁通用人工智能研究中心提出AlignXplore方法，通过强化学习和深度思考从用户行为中归纳偏好，并且这种对人类偏好的洞察可以动态更新。AlignXplore让AI更好地理解并回应用户的个性化需求。

GUI定位还在玩「非黑即白」？浙大团队提出GUI-G²，显著提升GUI智能体定位性能

2025年8月3日16时作者机器之心

本文介绍了一种新的GUI Grounding方法——GUI-G²，通过引入双重高斯奖励机制和自适应方差机制来提升GUI智能体的定位精度和空间覆盖能力。

九天大模型大变身：性能狂飙35%！还能一键P大象

2025年8月3日16时作者新智元

人工智能大会上，九天基础大模型端到端技术全面升级，性能飙升35%，智能体调用效率提升21%，15T

图灵奖得主Sutton再突破：强化学习在控制问题上媲美深度强化学习？

2025年8月3日16时作者机器之心

Sutton 提出的新算法 Swift-Sarsa 结合了时序差分学习 SwiftTD 的核心思想与 True Online Sarsa (λ)，用于线性控制问题。实验表明，Swift-Sarsa 在操作性条件反射基准测试中的性能随元步长和初始步长参数的变化而变化，并且结合预处理方法后在复杂问题上可达到与深度强化学习算法相当的性能水平。