清华校友用AI破解162个高数定理，智能体LeanAgent攻克困扰陶哲轩难题！

AI-Agent1年前 (2024)发布 AIera

2,969 0 0

清华校友用AI破解162个高数定理，智能体LeanAgent攻克困扰陶哲轩难题！

文章摘要

由加州理工学院、斯坦福大学和华盛顿大学的研究人员开发的LeanAgent，是一个具有终身学习能力的AI智能体，能够证明数学定理。该智能体通过优化学习轨迹和动态数据库管理，有效提高了学习策略，并在不断扩展的数学知识中进行有效管理。LeanAgent在自我学习新知识的同时，不会遗忘已具备的能力，成功证明了162个以前未被证明的数学定理，性能提升了11倍，综合终身学习能力达到了94%。

LeanAgent的学习方法包括课程学习、动态数据库管理、检索器的渐进式训练和sorry定理证明。它采用课程学习方法，学习逐渐增加复杂度的数学代码库，优化了学习轨迹。动态数据库管理则涉及将排序后的代码库添加到LeanAgent的自定义动态数据库中，并在每个定理的复杂度中包含在动态数据库中。渐进式训练使LeanAgent能够持续适应新数据集中前提的新数学知识，同时保留先前学习的信息。对于每个sorry定理，LeanAgent通过最佳优先树搜索生成证明。

LeanAgent在多个代码库中展示了持续的泛化能力和定理证明能力的提升，其证明是ReProver所证明的sorry定理的超集。LeanAgent的学习进展从基本概念逐步深入到高级主题，如抽象代数、拓扑学等。在终身学习结束时，LeanAgent相比ReProver的改进因子在不同代码库中有所不同，但普遍表现出优越性。

此外，LeanAgent在处理稳定性-可塑性权衡方面展现出优越性。它在多个指标上表现出卓越的稳定性，有效地保持性能，并对灾难性遗忘展现出强大的抵抗力。LeanAgent的综合得分也表现出色，能够在适应新任务的同时保持已有知识，使其成为最适合终身学习智能体的设置。这些结果有助于解释LeanAgent在sorry定理证明性能方面的优势，并展示了其在处理不断扩大、可能更复杂的数据集时的高度且一致的抵抗力。