国产AI大战高考物理，第1题全对，第2题开始放飞

AIGC动态1年前 (2024)发布 QbitAI

2,619 0 0

文章摘要

在端午节期间，一些地区的高考已结束，而考生们仍在挑战各种科目。本文通过让大型AI模型尝试解答一份辽宁物理试卷的选择题，以此来观察它们的表现。这些AI模型包括通义千问、文心一言、Kimi、智谱清言等。

在单选题环节，AI模型们普遍对第一题，一个关于标量矢量的概念题，有较高的准确率。然而，从第二题开始，各模型的表现出现了分歧。例如，通义千问、文心一言和讯飞星火对第二题进行了详细分析，而海螺AI和腾讯元宝的回答则较为简洁。在第5题中，讯飞星火、海螺AI、Kimi和腾讯元宝给出了正确答案。有趣的是，有些AI模型即使未能找到正确答案，也会展现出一定的解题技巧，如选择看上去较正确的选项。

在多选题环节，AI模型们面临更大挑战。海螺AI在多选题中表现最佳，有两题全对和一题部分正确。通义千问、文心一言和万知也有不错的表现。例如，在第8题，一个关于X射线光电子能谱仪的概念题中，多个AI模型给出了正确答案。在第9题中，海螺AI和万知选中了全部正确选项。

总的来说，在这份物理试卷的46分选择题中，AI模型们展现了一定的解题能力，不少模型能够拿到及格分数。这一测试不仅是对AI模型能力的检验，也为未来的学习和改进提供了参考。