Sam Altman 宣布:GPT-5 即将发布。

刚刚,Sam Altman在X 上宣布,OpenAI的通用推理系统在2025年国际数学奥林匹克竞赛(IMO)中达到了金牌水平的表现。

更重要的是,他同时宣布:GPT-5即将发布。并配了一张金色青蛙的表情:

这不是什么专门训练的数学系统,而是一个真正的大语言模型在做数学——
这是OpenAI朝着通用人工智能迈进的重要一步。
Sam Altman 回忆道,当初创立OpenAI时,这还只是一个遥不可及的梦想。
短短十年,AI 的进步让所有人目瞪口呆。
数学奥赛的新王者

OpenAI研究员Alexander Wei(@alexwei_)详细介绍了这次突破:
模型在完全相同的规则下参加考试:两场各4.5小时的考试,不能使用任何工具或互联网,阅读官方题目,用自然语言写出证明过程。

这次的突破极其重要。
IMO题目需要持续的创造性思维,这是过去任何基准测试都无法比拟的。
从推理时间跨度来看,AI已经从GSM8K(顶尖人类约0.1分钟)→ MATH基准(约1分钟)→ AIME(约10分钟)→ IMO(约100分钟) 逐步进化。
IMO的答案是难以验证的多页证明。
Alexander Wei给了个例子:




要在这里取得进展,必须超越传统的强化学习范式——那种有明确、可验证奖励的范式。通过这样做,OpenAI获得了一个能够构建复杂、严密论证的模型,达到了人类数学家的水平。
通用能力,而非特定技巧
Alexander Wei强调,他们达到这个能力水平不是通过狭隘的、任务特定的方法,而是通过在通用强化学习和测试时计算扩展方面开辟新天地。
在评估中,模型解决了2025年IMO的6道题中的5道。每道题由三位前IMO奖牌获得者独立评分,在达成一致意见后确定最终分数。
模型总共获得了35/42分——
足以获得金牌!🥇
团队成员包括@SherylHsu02、@polynoamial等人,Alexander Wei感谢能与这些优秀的人一起工作。
GPT-5即将到来,但…

Sam Altman和Alexander Wei都确认:GPT-5即将发布。
但他们也明确表示,这是一个实验模型,融入了将在未来模型中使用的新研究技术。虽然用户会喜欢GPT-5,但具有IMO金牌级数学能力的模型还要等几个月才会发布。
Alexander Wei分享了一个有趣的回忆:2021年,他的博士导师@JacobSteinhardt让他预测到2025年7月AI在数学方面的进展。

他当时预测MATH基准测试能达到30%(还觉得其他人都太乐观了)。
结果呢?
现在是IMO金牌水平。
如果你想看看模型的解答,可以访问:https://github.com/aw31/openai-imo-2025-proofs/
模型解决了P1到P5题目,没能解决P6。
Alexander Wei 还提前为模型独特的风格道歉,毕竟这还是个实验模型😅
写在最后
当AI 能够在数学奥赛中击败人类精英,或许我们终于真的站在了一个新时代的门槛之上。

Sam Altman说这曾是一个「不太现实的梦想」,但现在它成真了。
从解决简单的算术题到证明复杂的数学定理,从几秒钟的计算到100分钟的深度思考——
AI正在学会像数学家一样思考。

而GPT-5的到来,可能会带来更多我们意想不到的突破。
虽然具备IMO金牌能力的版本还要等待,但GPT-5本身的发布已经箭在弦上。
我似乎已经闻到了它的味道,或许,就在7月内。
来抽个票吧:
(文:AGI Hunt)