跑分超 o1，还会看图思考，数理化正在被 AI「完爆」

1,978 0 0

文章摘要

Kimi的「高阶推理模型」k1的发布标志着大模型在自我对抗强化学习方面迈出了重要一步，预示着AI可能超越人类知识边界。k1模型不仅提升了推理能力，还能识别几何图形、图表等图像信息，其在基础科学领域的能力显著提升，尤其在数理化三科的表现超越了OpenAI o1、GPT-4o和Claude 3.5 Sonnet。

k1模型的「数理化」能力扩增，使其在基础学科测试中表现优异，甚至在奥赛数学等高阶问题上也展现出强解析能力。k1的应用价值主要体现在两个方面：一是对视觉内容的「端到端」支持，能够识别并推理解答用户输入的问题截图、拍照或手写题目；二是具备「思维链」技术，让用户看到模型思考和推演答案的全过程。

k1模型的「一步步思考」能力使其在解答数理化问题时展现出细致的思考过程，甚至主动从其他角度进行二次思考以验证想法。这种「反思」能力通过思维链技术，使大模型输出的内容更有逻辑、可控且灵活，有助于消除「幻觉」问题，提升AI的安全性和可靠性。

k1模型的高阶推理能力、思维链和端到端视觉输入，正在颠覆大模型AI的应用。过去大模型主要通过模仿人类说话、写字的方式进行学习，但k1的「反思」能力意味着AI未来可能通过自我对抗强化学习产生新知识，超越人类知识边界。例如，AlphaGo和AlphaZero就是通过强化学习方法产生了超越人类的智能。Kimi k1甚至能够通过思考发掘出古代科学家手稿中的背景信息，展现出AI在知识和智能新维度上的潜力。