DeepMind夺得IMO官方「唯一」金牌，却成为OpenAI大型社死现场

AIGC动态1个月前发布 almosthuman2014

577 0 0

文章摘要

谷歌 DeepMind 宣布其新一代 Gemini 进阶版模型在国际数学奥林匹克竞赛（IMO）中达到了金牌得主水平，成功解决了六道超高难度试题中的五道，获得 35 分（满分 42 分）。这是首个被奥赛组委会官方认定为金牌的AI系统，标志着人工智能在无需依赖专业编程语言的情况下，仅通过自然语言理解即可攻克复杂数学难题。这一成就超越了谷歌在 2024 年的表现，当时 AlphaProof 和 AlphaGeometry 系统组合解决了六个问题中的四个，荣获银牌。

Gemini Deep Think 是此次突破的核心，它采用了并行思维技术，与传统人工智能模型不同，它同时探索多种可能的解决方案，最终得出答案。该系统在比赛标准的 4.5 小时时限内完成了任务，直接从官方问题描述中生成严格的数学证明。谷歌 DeepMind 首席执行官哈萨比斯强调，这一结果是官方认可的，并赢得了 AI 界的广泛赞誉。

相比之下，OpenAI 因绕过官方竞赛规则提前官宣其成绩，引发了争议。OpenAI 让一个由前 IMO 参赛选手组成的小组对其 AI 的表现进行评分，社区中的一些人认为这种做法缺乏可信度。OpenAI 研究科学家 Noam Brown 回应称，谷歌的方法与其不同，表明还有很多研究方向值得探讨。OpenAI 强调其在通用推理方面取得了很大进展，并公开了其证明以供验证。

这场 AI 登上数学奥林匹克舞台的较量，不仅是一次技术竞赛，更是一场关于规范、节奏与合作精神的展示。DeepMind 选择了等待官方认可，再谨慎发布成绩，赢得了金牌，也赢得了尊重。而 OpenAI 尽管也取得了不俗成果，却因时机与方式的问题，引发了争议。这提醒我们，在通往通用人工智能（AGI）的路上，除了技术力，如何与人类社会的规则与价值观对齐，正变得愈发重要。