文章摘要
【关 键 词】 Transformer、数学难题、AI社区、动态系统、前向示例
Meta研究者发现,Transformer模型能够解决132年前提出的数学难题——发现全局李雅普诺夫函数。这一发现被发表在NeurIPS 2024上,引起了AI社区的广泛关注。全局李雅普诺夫函数是分析系统随时间稳定性的关键工具,对于预测动态系统行为至关重要,如天体力学中的三体问题。尽管三体问题不能精确求解,但Meta AI的研究提供了新的视角。
研究者通过精心选择训练样本,而非更改架构,使得Transformer学会了解决这一复杂符号数学问题。他们并不认为Transformer是在进行推理,而是可能通过一种“超级直觉”来解决问题,这种直觉源自对数学问题的深刻理解。尽管Transformer的“思维过程”仍是一个黑箱,但其提供的解决方案明确,且数学正确性可以得到验证。
研究者引入了一种后向生成技术来训练模型,根据Lyapunov函数创建动力系统,并通过逆向生成数据训练的模型,在可以用数值工具求解的多项式系统测试集上取得了良好的性能。通过向训练集中添加少量简单且可解决的“前向”示例,性能得到了极大提高。在稳定性未知的一组随机动力系统上,模型在10%到13%的情况下能找到新的李亚普诺夫函数,准确率超过80%,远超过硕士生级别的人类数学家在这项任务上的准确率。
这项研究证明了生成式AI模型可以用于解决数学中的研究级问题,为数学家提供可能解的猜测。研究者相信,这项研究是一个“AI解决数学开放问题”的蓝图,预示着AI在基础科学研究中的潜力。
原文和模型
【原文链接】 阅读原文 [ 4542字 | 19分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...