Copilot上大分，仅数天，陶哲轩的估计验证工具卷到2.0！刚刚又发数学形式化证明视频

AIGC动态3个月前发布 almosthuman2014

876 0 0

Copilot上大分，仅数天，陶哲轩的估计验证工具卷到2.0！刚刚又发数学形式化证明视频

文章摘要

菲尔兹奖得主陶哲轩近期发布了一个开源项目，旨在通过大模型的协助开发一个概念验证软件工具，用于验证涉及任意正参数的给定估计是否成立。该项目最初的目标是自动化或半自动化标量函数渐近估计的证明，但陶哲轩已将其扩展为一个更为灵活的证明助手。该工具基于Python的符号代数包sympy，能够处理命题逻辑，并在功能上模仿了Lean证明助手。陶哲轩认为，这一框架已经足够稳定，并具备进一步扩展的潜力。

在2.0版本中，陶哲轩对工具进行了两次重要改进。首先，他将其改造为一个基础的证明助手，随后根据反馈进一步优化，使其更加灵活。该工具支持全自动证明，但陶哲轩目前更关注半自动交互式证明，即用户提供高级策略，工具执行必要的计算。这一设计旨在简化繁琐的数学任务，例如验证不等式或估计的推导过程。陶哲轩强调，尽管该工具的功能尚不及Lean、Isabelle或Rocq等完整证明助手，但它能够轻松处理一些简短而复杂的任务。

工具的具体实现过程包括用户通过Python加载预先制作的练习，并使用各种策略简化问题。例如，在证明“如果x, y, z是正实数，且x<2y且y<3z+1，则x<7z+2”时，用户可以使用线性算法策略“Linarith()”来解决问题。此外，工具还支持渐近估计，陶哲轩在Sympy中实现了量级形式化，并利用对数形式的线性算术自动验证一些渐近估计。这一功能为处理低阶项提供了强有力的支持。

陶哲轩还计划开发用于估计符号函数的函数空间范数工具，并引入更多策略和引理，例如Holder不等式和Sobolev嵌入不等式。目前，他已通过算术平均-几何平均引理验证了这一框架的可行性。他对这一工具的基本框架表示满意，并欢迎社区贡献新的数据类型、引理和策略。

此外，陶哲轩还进行了一项实验，尝试利用GitHub Copilot和Lean证明助手半自动地形式化一页纸的数学证明。这一实验展示了AI工具在代劳繁琐推理方面的潜力，使数学家能够专注于表达而非合理性。实验还揭示了Lean项目协作工具的一些局限性，例如blueprint工具无法同时记录多个证明版本。陶哲轩希望通过这一实验推动数学形式化工具的进一步发展，并为社区提供更多实用资源。