中国队重夺IMO奥数冠军，6金双满分碾压全场，AI连铜牌都拿不到

AIGC动态3周前发布 almosthuman2014

568 0 0

文章摘要

在国际数学奥林匹克竞赛（IMO）中，中国队以六金、双满分的优异成绩重夺冠军，总分达到231分。中国队在本次比赛中表现尤为突出，前五道题目全部获得满分，第六题也以21分的团队成绩位居全场最高。本届中国代表队由六名高中生组成，其中邓哲文和徐祺铭已连续两届入选国家队，展现了他们的卓越实力。自1985年中国队首次参加IMO以来，已有17位选手连续两届入选国家队，其中包括北京大学助理教授韦东奕，他曾在2008年和2009年两次获得满分。自2019年至2023年，中国队连续获得IMO冠军，再次证明了其在全球数学竞赛中的领先地位。

美国队以五金一银的成绩位居第二，韩国队和日本队分别获得第三和第四名。韩国队获得四金二银，日本队则获得三金二银一铜，其中日本选手加野聪一人获得满分金牌。此外，加拿大派出了纯华人的阵容，获得两金两银一铜，位居第十二位，其中Warren Bei也获得了满分金牌。这些成绩反映了全球各国在数学竞赛中的激烈竞争和多样化表现。

IMO是一项面向高中生的全球性数学竞赛，被誉为数学界的世界杯。自1959年首次在罗马尼亚举办以来，IMO已发展成为年度国际赛事，每年吸引来自五大洲100多个国家和地区的数学顶尖少年参与。今年的IMO是第66届，在澳大利亚昆士兰州阳光海岸举行，这是继1988年澳大利亚堪培拉第29届IMO之后，澳大利亚第二次承办该赛事。

IMO的竞赛题目通常包括六道，分为两天进行，每天的考试时间为4.5小时，参赛者每天需完成3道题目，每题7分，满分42分。试题内容涵盖代数、几何、数论、组合等多个领域，旨在测试选手的数学知识和解题能力。金牌的分数线是35分，银牌28分，铜牌19分。今年的考题前五题对于顶级高手来说并不很难，因此共产生了72枚金牌，比去年多19个。相比之下，第六题难度极高，全球仅6人破解，最后5人获满分。

在AI大模型的表现方面，尽管Gemini 2.5 Pro在IMO 2025的测试中表现最佳，得分为31%（13分），但没有任何一个AI模型能够拿到铜牌。Gemini 2.5 Pro在之前的USAMO评估中曾因引用不存在的定理而受到批评，但在IMO 2025的表现中，这种行为有所减少，表明模型在此方面有所改进。刚刚发布的Grok 4成绩相对一般，许多初步回答非常简短，通常只是给出最终答案而没有任何解释，类似的问题在MathArena的其他基准测试中也有体现，Grok-4的回答经常缺乏深度或证明。在MathArena上，研究人员聘请了IMO级别人类评委进行评分，评估在2025年IMO题目发布后立即开始。平均而言，AI做题每道题答案的生成成本至少为3美元。

总体来看，尽管AI在数学竞赛中的表现有所进步，但在人类最高水平智力竞赛上，AI的能力还有待进一步提升。中国队的优异表现再次证明了其在全球数学竞赛中的领先地位，而全球各国的激烈竞争也反映了数学教育的高水平和多样化发展。