刚刚,Sam Altman宣布:GPT-5即将发布

Sam Altman 宣布:GPT-5 即将发布。

刚刚,Sam Altman在X 上宣布,OpenAI的通用推理系统在2025年国际数学奥林匹克竞赛(IMO)中达到了金牌水平的表现

更重要的是,他同时宣布:GPT-5即将发布。并配了一张金色青蛙的表情:

这不是什么专门训练的数学系统,而是一个真正的大语言模型在做数学——

这是OpenAI朝着通用人工智能迈进的重要一步。

Sam Altman 回忆道,当初创立OpenAI时,这还只是一个遥不可及的梦想。

短短十年,AI 的进步让所有人目瞪口呆。

数学奥赛的新王者

OpenAI研究员Alexander Wei(@alexwei_)详细介绍了这次突破:

模型在完全相同的规则下参加考试:两场各4.5小时的考试,不能使用任何工具或互联网,阅读官方题目,用自然语言写出证明过程。

这次的突破极其重要。

IMO题目需要持续的创造性思维,这是过去任何基准测试都无法比拟的。

从推理时间跨度来看,AI已经从GSM8K(顶尖人类约0.1分钟)→ MATH基准(约1分钟)→ AIME(约10分钟)→ IMO(约100分钟) 逐步进化。

IMO的答案是难以验证的多页证明

Alexander Wei给了个例子:

要在这里取得进展,必须超越传统的强化学习范式——那种有明确、可验证奖励的范式。通过这样做,OpenAI获得了一个能够构建复杂、严密论证的模型,达到了人类数学家的水平。

通用能力,而非特定技巧

Alexander Wei强调,他们达到这个能力水平不是通过狭隘的、任务特定的方法,而是通过在通用强化学习和测试时计算扩展方面开辟新天地。

在评估中,模型解决了2025年IMO的6道题中的5道。每道题由三位前IMO奖牌获得者独立评分,在达成一致意见后确定最终分数。

模型总共获得了35/42分——

足以获得金牌!🥇

团队成员包括@SherylHsu02、@polynoamial等人,Alexander Wei感谢能与这些优秀的人一起工作。

GPT-5即将到来,但…

Sam Altman和Alexander Wei都确认:GPT-5即将发布

但他们也明确表示,这是一个实验模型,融入了将在未来模型中使用的新研究技术。虽然用户会喜欢GPT-5,但具有IMO金牌级数学能力的模型还要等几个月才会发布。

Alexander Wei分享了一个有趣的回忆:2021年,他的博士导师@JacobSteinhardt让他预测到2025年7月AI在数学方面的进展。

他当时预测MATH基准测试能达到30%(还觉得其他人都太乐观了)。

结果呢?

现在是IMO金牌水平。

如果你想看看模型的解答,可以访问:https://github.com/aw31/openai-imo-2025-proofs/

模型解决了P1到P5题目,没能解决P6。

Alexander Wei 还提前为模型独特的风格道歉,毕竟这还是个实验模型😅

写在最后

当AI 能够在数学奥赛中击败人类精英,或许我们终于真的站在了一个新时代的门槛之上。

Sam Altman说这曾是一个「不太现实的梦想」,但现在它成真了。

从解决简单的算术题到证明复杂的数学定理,从几秒钟的计算到100分钟的深度思考——

AI正在学会像数学家一样思考

而GPT-5的到来,可能会带来更多我们意想不到的突破。

虽然具备IMO金牌能力的版本还要等待,但GPT-5本身的发布已经箭在弦上。

我似乎已经闻到了它的味道,或许,就在7月内。

来抽个票吧:

(文:AGI Hunt)

发表评论