![天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题](https://www.xuexiaigc.com/wp-content/uploads/article-images/7f1c74007f9048539d.jpeg)
文章摘要
【关 键 词】 AlphaGeometry 2、数学奥林匹克、符号引擎DDAR、自动形式化、AI数学应用
谷歌DeepMind的AI系统AlphaGeometry 2(AG2)在国际数学奥林匹克(IMO)的几何题目上取得了重大突破。AG2的解题率从54%飙升至84%,在2000-2024年IMO几何题上横扫了42道题目,超越了IMO金牌得主的平均水平。这一成就得益于AG2采用的全新搜索算法——基于知识共享集成的搜索树(SKEST),它允许多个集束搜索并行运行并相互帮助,使得AG2能在19秒内解决IMO 2024年P4题。
AG2的核心是其符号引擎DDAR(演绎数据库与算术推理),它通过固定的推理规则推导出新的事实,为语言模型生成训练数据,并在测试时进行证明搜索。DDAR的三个主要改进包括处理重合点的能力、更快的算法和更快的实现,特别是使用C++重新实现后,AG2的速度比AG1快了300多倍。
AG2的成功还归功于其改进的合成训练数据。与AG1相比,AG2的数据集更大、更多样化、更复杂,从而显著提升了模型的性能。AG2的数据生成算法生成了更大、更复杂的图和更好的数据分布,以及更多类型的定理,包括轨迹类型的问题。
AG2还展示了自动形式化和图形生成的能力。它能够将IMO几何问题从自然语言翻译成专用语言,并采用两阶段数值优化方法为非构造性问题生成图形。这些改进使得AG2在所有IMO几何题上取得了84%的解题率,超越了IMO金牌得主的平均水平。
尽管AG2在解决几何问题上表现出色,但仍有一些问题尚未解决,包括无法形式化的问题和需要高级几何解法技巧的问题。这些问题的解决需要更长的推理时间、更长的证明过程,以及更多的辅助构造来弥补当前技术的不足。总的来说,AG2在数学问题解决方面展现出了超凡的创造力,为AI在数学领域的应用开辟了新的可能性。
原文和模型
【原文链接】 阅读原文 [ 5600字 | 23分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★