OpenAI IMO金牌团队爆料:AI拒绝作答第六题
OpenAI团队通过三个核心开发者在IMO竞赛中使用模型赢得了金牌。该项目仅用两三个月时间完成,涉及数学证明风格独特、难以读懂的AI生成问题解答。
OpenAI团队通过三个核心开发者在IMO竞赛中使用模型赢得了金牌。该项目仅用两三个月时间完成,涉及数学证明风格独特、难以读懂的AI生成问题解答。
蚂蚁通用人工智能研究中心提出AlignXplore方法,通过强化学习和深度思考从用户行为中归纳偏好,并且这种对人类偏好的洞察可以动态更新。AlignXplore让AI更好地理解并回应用户的个性化需求。
本文介绍了一种新的GUI Grounding方法——GUI-G²,通过引入双重高斯奖励机制和自适应方差机制来提升GUI智能体的定位精度和空间覆盖能力。
Sutton 提出的新算法 Swift-Sarsa 结合了时序差分学习 SwiftTD 的核心思想与 True Online Sarsa (λ),用于线性控制问题。实验表明,Swift-Sarsa 在操作性条件反射基准测试中的性能随元步长和初始步长参数的变化而变化,并且结合预处理方法后在复杂问题上可达到与深度强化学习算法相当的性能水平。
觉编码器,通过特征对齐
+
指令微调构建的中文超小多模态大模型,
可在
1 GB
显存设备完成推理,
几天前开源 Coze Studio 需要4核8G硬件条件。火山引擎带来了 ECS 和豆包新模型 doubao-seed-1.6-thinking,部署方案独家开源,部署过程非常便捷。介绍开源版 Coze 的主要功能和优势,如能创建智能体、生成提示语等。
斩获 ACL 最佳论文
:梁文锋团队的原生稀疏注意力技术将长文本处理速度提升 11 倍,可支持百万
分享ACl 2025最佳论文《Language Models Resist Alignment: Evidence From Data Compression》提出并量化了Elasticity概念,揭示语言模型具有“抗对齐”现象,即使轻微下游微调也会使模型迅速回弹至预训练分布。