DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场

文章摘要
【关 键 词】 人工智能、数学竞赛、自然语言、谷歌、OpenAI
谷歌 DeepMind 宣布其新一代 Gemini 进阶版模型在国际数学奥林匹克竞赛(IMO)中达到了金牌得主水平,成功解决了六道超高难度试题中的五道,获得 35 分(满分 42 分)。这是首个被奥赛组委会官方认定为金牌的AI系统,标志着人工智能在无需依赖专业编程语言的情况下,仅通过自然语言理解即可攻克复杂数学难题。这一成就超越了谷歌在 2024 年的表现,当时 AlphaProof 和 AlphaGeometry 系统组合解决了六个问题中的四个,荣获银牌。
Gemini Deep Think 是此次突破的核心,它采用了并行思维技术,与传统人工智能模型不同,它同时探索多种可能的解决方案,最终得出答案。该系统在比赛标准的 4.5 小时时限内完成了任务,直接从官方问题描述中生成严格的数学证明。谷歌 DeepMind 首席执行官哈萨比斯强调,这一结果是官方认可的,并赢得了 AI 界的广泛赞誉。
相比之下,OpenAI 因绕过官方竞赛规则提前官宣其成绩,引发了争议。OpenAI 让一个由前 IMO 参赛选手组成的小组对其 AI 的表现进行评分,社区中的一些人认为这种做法缺乏可信度。OpenAI 研究科学家 Noam Brown 回应称,谷歌的方法与其不同,表明还有很多研究方向值得探讨。OpenAI 强调其在通用推理方面取得了很大进展,并公开了其证明以供验证。
这场 AI 登上数学奥林匹克舞台的较量,不仅是一次技术竞赛,更是一场关于规范、节奏与合作精神的展示。DeepMind 选择了等待官方认可,再谨慎发布成绩,赢得了金牌,也赢得了尊重。而 OpenAI 尽管也取得了不俗成果,却因时机与方式的问题,引发了争议。这提醒我们,在通往通用人工智能(AGI)的路上,除了技术力,如何与人类社会的规则与价值观对齐,正变得愈发重要。
原文和模型
【原文链接】 阅读原文 [ 1257字 | 6分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek-v3
【摘要评分】 ★★☆☆☆