「AI重大飞跃」OpenAI官宣：内部实验模型在IMO 2025中取得金牌，GPT-5即将发布

刚刚，OpenAI研究员Alexander Wei通过社交媒体宣布了一项人工智能领域的历史性突破：其团队开发的最新实验性内部推理模型，在全球最负盛名的数学竞赛——国际数学奥林匹克（IMO2025）中，取得了相当于人类金牌选手的惊人成绩(注意这个OAI内部模型内部评估，不是这次参赛IMO2025的o3 high)

与此同时，他还在帖子中透露：备受全球关注的GPT-5即将发布

夺金过程

为了验证这个内部实验模型的真实能力，OpenAI完全按照人类选手的竞赛规则对AI进行了评估。模型在模拟的2025年IMO竞赛中，于两个4.5小时的时段内，不借助任何外部工具或互联网，仅凭阅读官方问题，便以自然语言完成了复杂的证明过程

最终，该模型成功解决了6个问题中的5个，总分高达35/42，这一分数足以在人类竞赛中斩获金牌

Alexander Wei指出，这一成就意义非凡，因为它不仅要求AI具备前所未有的、长达100分钟的持续创造性思维，还攻克了传统强化学习难以处理的、逻辑严密但难以量化奖励的复杂证明任务。这代表着AI在通用推理能力上的巨大飞跃，给大家一个直观难度对比：人类和AI所面对的难度分别为GSM8K（约0.1分钟）、MATH基准测试（约1分钟）、美国数学邀请赛AIME（约10分钟），而IMO则达到约100分钟

更令人兴奋的是，这一进步并非依赖于针对单一任务的特定技术，而是通过通用强化学习方法与更大规模的计算资源相结合实现的。这意味着此类方法具有广泛的潜在应用空间，不局限于数学推理

如果你想看的话，这里有该模型对2025年IMO题目的解答！该模型解决了P1到P5的问题；但P6的问题它没有给出答案

https://github.com/aw31/openai-imo-2025-proofs/

GPT-5即将发布

在宣布这项数学领域的突破之余，Alexander Wei在帖子中明确提到：“顺便说一句，我们很快就要发布GPT-5了，我们很期待大家来尝试它。”

不过，他紧接着做出了重要澄清：此次在IMO竞赛中取得惊人成就的“数学金牌模型”是一个独立的实验性研究项目。OpenAI在未来几个月内，并不计划发布具有如此顶尖数学能力的模型。

这意味着，即将到来的GPT-5虽然令人期待，但其能力表现将与这个专攻高难度数学推理的“天才模型”有所区别

AI发展速度远超想象

Alexander Wei还分享道，AI的发展速度已远超专家预期。他回忆说，在2021年，他曾预测到2025年AI在MATH基准测试上能达到30%的准确率就已非常乐观。然而现实是，AI不仅远超该目标，甚至提前摘下了IMO金牌。

这一系列成就不仅是OpenAI团队的胜利，也预示着通用人工智能正以前所未有的速度向我们走来

（文：AI寒武纪）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

夺金过程

GPT-5即将发布

AI发展速度远超想象

发表评论 取消回复

发表评论取消回复