AI | MO数学竞赛启动，陶哲轩力荐！50题对3道，百万大奖抱回家

AIGC动态1年前 (2024)发布 AIera

1,791 0 0

文章摘要

新智元最近报道了一项针对人工智能模型的数学竞赛，这场比赛吸引了广泛关注，因为它提供了高达104.8万美元的奖金。

参赛的AI模型需要在50个数学题中至少解出3题，以达到官方基准模型Gemma 7B的水平。这些题目覆盖了基础算术、代数思维和几何推理等领域，难度相当于高中级别的学术竞赛。

比赛的目的是推动AI在数学推理方面的能力，挑战者需要创建能够解决LaTeX格式编写的棘手数学问题的算法和模型。这不仅是对AI模型的一次测试，也是对其数学推理能力的一次提升。比赛的组织者kaggle希望通过这样的比赛，激发开发者们构建出能与国际数学奥林匹克（IMO）顶尖选手匹敌的AI模型。

为了确保比赛的公平性，组织者采用了一个由国际专家团队设计的数据集，以避免训练-测试泄露问题，即模型在训练过程中接触到测试题目的情况。这个数据集包含110道全新的数学题，难度覆盖了从基础算术到代数思维、几何推理等不同层次。

比赛的时间表已经公布，从2024年4月1日开始，到6月27日结束，其中6月20日是报名和团队合并的最后期限。奖项设置包括进步奖和综合进步奖，前者将根据排名发放奖金，如果前五名的团队都未能超过基准分数，奖金将减少到原来的四分之一。综合进步奖将授予在公开及私有测试集上至少获得47/50分的最高排名团队，如果没有团队获得该奖，剩余的奖金将转入下一届比赛。

评估方法将基于提交的预测标签与真实标签之间的准确性，即预测标签与真实标签完全匹配的比例。此外，参赛作品需要通过Notebooks提交，并且必须满足一定的条件，如运行时间限制、禁止互联网访问等。

这场比赛不仅是AI技术的一次展示，也是对AI在数学领域应用的一次重大挑战。它将推动AI技术在数学推理方面的发展，并可能催生出新的、更强大的AI模型。随着比赛的进行，我们期待看到AI在解决复杂数学问题上的新突破。