全球首个IMO金牌AI诞生!谷歌Gemini碾碎奥数神话,拿下35分震惊裁判

AIGC动态8小时前发布 AIera
65 0 0
全球首个IMO金牌AI诞生!谷歌Gemini碾碎奥数神话,拿下35分震惊裁判

 

文章摘要


【关 键 词】 AI数学竞赛自然语言推理

谷歌DeepMind凭借其最新模型Gemini Deep Think在国际数学奥林匹克竞赛(IMO)中取得了历史性突破,成功摘得金牌。这一成就标志着AI在数学推理领域的重大进展,尤其是在自然语言处理与复杂问题解决能力上的显著提升。Gemini Deep Think在4.5小时内完成了5道IMO题目,获得了35分(满分42分),并得到了IMO组委会的官方认证,成为首个获得金牌级别认可的AI系统。

IMO作为数学界的顶级赛事,每年吸引全球顶尖学生参与,参赛者需在有限时间内解决涵盖代数、几何、组合数学和数论的复杂问题。近年来,IMO逐渐成为AI能力的试炼场,数学问题不仅考验逻辑推理,还要求创造性思维和严谨性。2024年,AlphaProof和AlphaGeometry 2曾破解4题,达到银牌水平,而Gemini Deep Think的突破则进一步将AI推向了金牌行列。

Gemini Deep Think的独特之处在于其完全依赖自然语言进行端到端推理。与以往需要将问题翻译为形式语言的模型不同,Gemini直接从官方问题描述中生成严谨的数学证明,并在比赛时间限制内完成。这一能力得益于其Deep Think模式,该模式结合了并行思考技术,允许模型同时探索多种解题路径,最终整合出最优答案。此外,谷歌通过强化学习训练和提供高质量解决方案集,进一步提升了Gemini的推理能力。

在具体解题过程中,Gemini展示了其强大的数学推理能力。例如,在解析几何题中,模型通过设定引理和定理,逐步证明了唯一可能的阳光线数量为0、1或3条。在平面几何题中,模型通过五步证明,最终得出了直线VH是圆Σ在点V处切线的结论。此外,模型在函数题、数论题和组合博弈题中也展现了其化繁为简的能力,通过不变性和增长率分析,将复杂问题简化为可解决的固定点。

这一突破不仅证明了AI在数学领域的潜力,也为未来的AI发展提供了新的方向。谷歌DeepMind团队表示,他们将继续探索如何将自然语言能力与严谨的推理能力相结合,以构建能够解决更复杂数学问题的AI系统。与此同时,OpenAI虽然也在IMO中取得了一定成绩,但其未经官方认证的结果引发了争议,进一步凸显了谷歌DeepMind在这一领域的领先地位。

总体而言,Gemini Deep Think的成功标志着AI在数学推理和自然语言处理方面的重大进步,为未来的AI应用和研究开辟了新的可能性。

原文和模型


【原文链接】 阅读原文 [ 2921字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...