
刚刚,OpenAI研究员Alexander Wei通过社交媒体宣布了一项人工智能领域的历史性突破:其团队开发的最新实验性内部推理模型,在全球最负盛名的数学竞赛——国际数学奥林匹克(IMO2025)中,取得了相当于人类金牌选手的惊人成绩(注意这个OAI内部模型内部评估,不是这次参赛IMO2025的o3 high)

与此同时,他还在帖子中透露:备受全球关注的GPT-5即将发布
夺金过程
为了验证这个内部实验模型的真实能力,OpenAI完全按照人类选手的竞赛规则对AI进行了评估。模型在模拟的2025年IMO竞赛中,于两个4.5小时的时段内,不借助任何外部工具或互联网,仅凭阅读官方问题,便以自然语言完成了复杂的证明过程
最终,该模型成功解决了6个问题中的5个,总分高达35/42,这一分数足以在人类竞赛中斩获金牌
Alexander Wei指出,这一成就意义非凡,因为它不仅要求AI具备前所未有的、长达100分钟的持续创造性思维,还攻克了传统强化学习难以处理的、逻辑严密但难以量化奖励的复杂证明任务。这代表着AI在通用推理能力上的巨大飞跃,给大家一个直观难度对比:人类和AI所面对的难度分别为GSM8K(约0.1分钟)、MATH基准测试(约1分钟)、美国数学邀请赛AIME(约10分钟),而IMO则达到约100分钟
更令人兴奋的是,这一进步并非依赖于针对单一任务的特定技术,而是通过通用强化学习方法与更大规模的计算资源相结合实现的。这意味着此类方法具有广泛的潜在应用空间,不局限于数学推理
如果你想看的话,这里有该模型对2025年IMO题目的解答!该模型解决了P1到P5的问题;但P6的问题它没有给出答案

https://github.com/aw31/openai-imo-2025-proofs/
GPT-5即将发布
在宣布这项数学领域的突破之余,Alexander Wei在帖子中明确提到:“顺便说一句,我们很快就要发布GPT-5了,我们很期待大家来尝试它。”

不过,他紧接着做出了重要澄清:此次在IMO竞赛中取得惊人成就的“数学金牌模型”是一个独立的实验性研究项目。OpenAI在未来几个月内,并不计划发布具有如此顶尖数学能力的模型。
这意味着,即将到来的GPT-5虽然令人期待,但其能力表现将与这个专攻高难度数学推理的“天才模型”有所区别
AI发展速度远超想象
Alexander Wei还分享道,AI的发展速度已远超专家预期。他回忆说,在2021年,他曾预测到2025年AI在MATH基准测试上能达到30%的准确率就已非常乐观。然而现实是,AI不仅远超该目标,甚至提前摘下了IMO金牌。
这一系列成就不仅是OpenAI团队的胜利,也预示着通用人工智能正以前所未有的速度向我们走来
(文:AI寒武纪)