中国队重夺IMO奥数冠军,6金双满分碾压全场,AI连铜牌都拿不到

文章摘要
在国际数学奥林匹克竞赛(IMO)中,中国队以六金、双满分的优异成绩重夺冠军,总分达到231分。中国队在本次比赛中表现尤为突出,前五道题目全部获得满分,第六题也以21分的团队成绩位居全场最高。本届中国代表队由六名高中生组成,其中邓哲文和徐祺铭已连续两届入选国家队,展现了他们的卓越实力。自1985年中国队首次参加IMO以来,已有17位选手连续两届入选国家队,其中包括北京大学助理教授韦东奕,他曾在2008年和2009年两次获得满分。自2019年至2023年,中国队连续获得IMO冠军,再次证明了其在全球数学竞赛中的领先地位。
美国队以五金一银的成绩位居第二,韩国队和日本队分别获得第三和第四名。韩国队获得四金二银,日本队则获得三金二银一铜,其中日本选手加野聪一人获得满分金牌。此外,加拿大派出了纯华人的阵容,获得两金两银一铜,位居第十二位,其中Warren Bei也获得了满分金牌。这些成绩反映了全球各国在数学竞赛中的激烈竞争和多样化表现。
IMO是一项面向高中生的全球性数学竞赛,被誉为数学界的世界杯。自1959年首次在罗马尼亚举办以来,IMO已发展成为年度国际赛事,每年吸引来自五大洲100多个国家和地区的数学顶尖少年参与。今年的IMO是第66届,在澳大利亚昆士兰州阳光海岸举行,这是继1988年澳大利亚堪培拉第29届IMO之后,澳大利亚第二次承办该赛事。
IMO的竞赛题目通常包括六道,分为两天进行,每天的考试时间为4.5小时,参赛者每天需完成3道题目,每题7分,满分42分。试题内容涵盖代数、几何、数论、组合等多个领域,旨在测试选手的数学知识和解题能力。金牌的分数线是35分,银牌28分,铜牌19分。今年的考题前五题对于顶级高手来说并不很难,因此共产生了72枚金牌,比去年多19个。相比之下,第六题难度极高,全球仅6人破解,最后5人获满分。
在AI大模型的表现方面,尽管Gemini 2.5 Pro在IMO 2025的测试中表现最佳,得分为31%(13分),但没有任何一个AI模型能够拿到铜牌。Gemini 2.5 Pro在之前的USAMO评估中曾因引用不存在的定理而受到批评,但在IMO 2025的表现中,这种行为有所减少,表明模型在此方面有所改进。刚刚发布的Grok 4成绩相对一般,许多初步回答非常简短,通常只是给出最终答案而没有任何解释,类似的问题在MathArena的其他基准测试中也有体现,Grok-4的回答经常缺乏深度或证明。在MathArena上,研究人员聘请了IMO级别人类评委进行评分,评估在2025年IMO题目发布后立即开始。平均而言,AI做题每道题答案的生成成本至少为3美元。
总体来看,尽管AI在数学竞赛中的表现有所进步,但在人类最高水平智力竞赛上,AI的能力还有待进一步提升。中国队的优异表现再次证明了其在全球数学竞赛中的领先地位,而全球各国的激烈竞争也反映了数学教育的高水平和多样化发展。
原文和模型
【原文链接】 阅读原文 [ 1031字 | 5分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek-v3
【摘要评分】 ★★☆☆☆