中国队重夺IMO奥数冠军,6金双满分碾压全场,AI连铜牌都拿不到

机器之心报道

编辑:泽南、杨文

祝贺中国队!


本周六早上传来消息,在国际数学奥林匹克竞赛 IMO(International Mathematical Olympiad)比赛上中国队重夺冠军,获得了六金、双满分的佳绩。



从「成绩单」来看,中国队总分 231 分,在前五道题目中获得全满分,第六题拿下团队 21 分也为全场最高分。


本届中国代表队名单:


  • 邓哲文(高二) 湖北省武昌实验中学

  • 徐祺铭(高二) 武汉市经开外国语高级中学

  • 谈弘毅(高二) 武汉市经开外国语高级中学

  • 张恒烨(高二) 重庆市巴蜀中学校

  • 董镇宇(高三) 杭州学军中学

  • 邓乐言(高一) 上海市上海中学



其中邓哲文和徐祺铭已连续两届入选国家队。自 1985 年中国队首次参加 IMO 以来,已有 17 位选手连续两届入选国家队,包括北京大学助理教授韦东奕,他曾在 2008、2009 年两次获得满分。


自 2019 年到 2023 年,中国队曾连续获得 IMO 冠军。


去年的冠军美国队本次获得了五金一银的成绩,位居第二。



第三名韩国队四金二银,第四名日本队三金二银一铜,其中加野聪一人获得满分金牌。


另外本届加拿大派出了纯华人的阵容,获得两金两银一铜位居第十二位,Warren Bei 获得了满分金牌。



国际数学奥林匹克竞赛(InternationaMathematical Olympiad,简称 IMO)是一项面向高中生的全球性数学竞赛,被誉为数学界的世界杯。


在 1959 年,该项赛事首次在罗马尼亚举办,目前 IMO 已经发展成为一个年度国际赛事,每年来自五大洲 100 多个国家和地区的数学顶尖少年竞相角逐。


今年的 IMO 是第 66 届,在澳大利亚昆士兰州阳光海岸举行,比赛自 7 月 15 日开始。这是继 1988 年澳大利亚堪培拉第 29 届 IMO 之后,澳大利亚第二次承办 IMO 赛事。



IMO 2025 题目


IMO 的竞赛题目通常包括六道,分为两天进行,每天的考试时间为 4.5 小时,参赛者每天需完成 3 道题目,每题 7 分,满分 42 分。试题内容涵盖代数、几何、数论、组合等多个领域,旨在测试选手的数学知识和解题能力。


金牌的分数线是 35 分,银牌 28 分,铜牌 19 分。今年的考题据说前五题对于顶级高手来说并不很难,因此共产生了 72 枚金牌,比去年多 19 个。


相比之下,第六题难度极高,全球仅 6 人破解,最后 5 人获满分。


第一题:



第二题:



第三题:



第四题:



第五题:



第六题:



大家觉得今年的题目难度如何,在评论区聊聊吧。


大模型 IMO2025 成绩:无人拿牌


最后,可能你也会关心 AI 大模型在最新真题上的成绩如何。在另一个「赛场」上,有人也已经完成了测试,没有一个大模型能拿到铜牌


其中,Gemini 2.5 Pro 表现最佳,得分为 31%(13 分)在之前的 USAMO 评估中,Gemini 2.5 Pro 曾因在无法提供有效证明时引用不存在的定理而受到批评, 然而在 IMO 2025 的表现中,这种行为有所减少,表明模型在此方面有所改进。


刚刚发布的 Grok 4 成绩相对一般,许多初步回答非常简短,通常只是给出最终答案而没有任何解释,类似的问题在 MathArena 的其他基准测试中也有体现,Grok-4 的回答经常缺乏深度或证明。



在 MathArena 上,研究人员聘请了 IMO 级别人类评委进行评分,评估在 2025 年 IMO 题目发布后立即开始。平均而言,AI 做题每道题答案的生成成本至少为 3 美元。


看起来,在人类最高水平智力竞赛上,AI 的能力还有待进一步提升。


参考内容:

https://www.imo-official.org/results.aspx

https://matharena.ai/imo/


©

(文:机器之心)

发表评论