刚刚，Sam Altman宣布：GPT-5即将发布

Sam Altman 宣布：GPT-5 即将发布。

刚刚，Sam Altman在X 上宣布，OpenAI的通用推理系统在2025年国际数学奥林匹克竞赛（IMO）中达到了金牌水平的表现。

更重要的是，他同时宣布：GPT-5即将发布。并配了一张金色青蛙的表情：

这不是什么专门训练的数学系统，而是一个真正的大语言模型在做数学——

这是OpenAI朝着通用人工智能迈进的重要一步。

Sam Altman 回忆道，当初创立OpenAI时，这还只是一个遥不可及的梦想。

短短十年，AI 的进步让所有人目瞪口呆。

数学奥赛的新王者

OpenAI研究员Alexander Wei(@alexwei_)详细介绍了这次突破：

模型在完全相同的规则下参加考试：两场各4.5小时的考试，不能使用任何工具或互联网，阅读官方题目，用自然语言写出证明过程。

这次的突破极其重要。

IMO题目需要持续的创造性思维，这是过去任何基准测试都无法比拟的。

从推理时间跨度来看，AI已经从GSM8K（顶尖人类约0.1分钟）→ MATH基准（约1分钟）→ AIME（约10分钟）→ IMO（约100分钟） 逐步进化。

IMO的答案是难以验证的多页证明。

Alexander Wei给了个例子：

要在这里取得进展，必须超越传统的强化学习范式——那种有明确、可验证奖励的范式。通过这样做，OpenAI获得了一个能够构建复杂、严密论证的模型，达到了人类数学家的水平。

通用能力，而非特定技巧

Alexander Wei强调，他们达到这个能力水平不是通过狭隘的、任务特定的方法，而是通过在通用强化学习和测试时计算扩展方面开辟新天地。

在评估中，模型解决了2025年IMO的6道题中的5道。每道题由三位前IMO奖牌获得者独立评分，在达成一致意见后确定最终分数。

模型总共获得了35/42分——

足以获得金牌！🥇

团队成员包括@SherylHsu02、@polynoamial等人，Alexander Wei感谢能与这些优秀的人一起工作。

GPT-5即将到来，但…

Sam Altman和Alexander Wei都确认：GPT-5即将发布。

但他们也明确表示，这是一个实验模型，融入了将在未来模型中使用的新研究技术。虽然用户会喜欢GPT-5，但具有IMO金牌级数学能力的模型还要等几个月才会发布。

Alexander Wei分享了一个有趣的回忆：2021年，他的博士导师@JacobSteinhardt让他预测到2025年7月AI在数学方面的进展。

他当时预测MATH基准测试能达到30%（还觉得其他人都太乐观了）。

结果呢？

现在是IMO金牌水平。

如果你想看看模型的解答，可以访问：https://github.com/aw31/openai-imo-2025-proofs/

模型解决了P1到P5题目，没能解决P6。

Alexander Wei 还提前为模型独特的风格道歉，毕竟这还是个实验模型😅

写在最后

当AI 能够在数学奥赛中击败人类精英，或许我们终于真的站在了一个新时代的门槛之上。

Sam Altman说这曾是一个「不太现实的梦想」，但现在它成真了。

从解决简单的算术题到证明复杂的数学定理，从几秒钟的计算到100分钟的深度思考——

AI正在学会像数学家一样思考。

而GPT-5的到来，可能会带来更多我们意想不到的突破。

虽然具备IMO金牌能力的版本还要等待，但GPT-5本身的发布已经箭在弦上。

我似乎已经闻到了它的味道，或许，就在7月内。

来抽个票吧：

（文：AGI Hunt）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

数学奥赛的新王者

通用能力，而非特定技巧

GPT-5即将到来，但…

写在最后

发表评论 取消回复

发表评论取消回复