文章摘要
【关 键 词】 数学竞赛、人工智能、AlphaProof、AlphaGeometry、技术突破
谷歌DeepMind在2024年国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其开发的两个混合大模型AlphaProof和AlphaGeometry 2获得了银牌。IMO作为历史悠久且权威的数学竞赛,每年吸引全球精英数学家参与,也是衡量AI数学推理能力的重要平台。
AlphaProof在竞赛中解决了两道代数题和一个数论问题,而AlphaGeometry 2则答对了一道几何题。特别值得一提的是,AlphaProof解答了当年IMO最难的题目,仅有5位参赛者给出正确答案。AlphaGeometry 2的核心在于其神经符号框架,它能够自动解决欧几里得平面几何问题,绕过传统机器学习方法对大量人类证明数据的依赖,实现自我学习,并生成合成定理和证明。
AlphaGeometry的证明搜索是一个循环过程,语言模型和符号推理引擎交替运行,生成新的辅助构造并扩展推理闭包。证明修剪功能则去除不必要的辅助构造,确保证明的简洁性和可读性。此外,AlphaGeometry通过穷举试验和错误的方法进行证明修剪,找到并返回所有可能证明中的最短路径。
AlphaGeometry 2在一代的基础上进行了大量迭代和技术创新,使用了谷歌自研的Gemini作为语言模型,并在合成数据上从头开始训练。其符号引擎速度比前身快两个数量级,使用新的知识共享机制解决更复杂的数学难题。在IMO比赛前,AlphaGeometry 2能解决过去25年所有IMO几何问题的83%,而一代解决率只有53%。在正式比赛中,AlphaGeometry 2仅用19秒便解决了几何难题,展现了超高效率。
AlphaProof是谷歌最新开发的形式数学推理模型,结合预训练语言模型和AlphaZero强化学习算法,展现出强大的推理能力。它使用形式语言Lean进行数学证明,通过微调的Gemini大模型将自然语言问题转换为形式语言表述,创建大规模形式问题库。AlphaProof在面对新问题时生成解决方案候选,通过在Lean中搜索证明步骤来证明或反驳候选解,每个验证的证明都用来强化语言模型。
谷歌表示,尽管AI模型在解决一般数学问题时存在困难,但AlphaProof和AlphaGeometry 2已具备数学推理的AGI能力,可帮助数学专家发现新的解题方法,标志着AI在数学领域的重大技术突破。
原文和模型
【原文链接】 阅读原文 [ 1562字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆