Kimi 数理化能跟 o1 掰手腕了？新模型 k1 有点儿强

1,548 0 0

文章摘要

月之暗面公司宣布推出新的视觉思考模型k1，标志着其在数理化能力上的显著提升，与OpenAI的o1模型相比毫不逊色。k1模型能够识别图片中的文字，并解读背后的科学知识，提供清晰的推理思考过程。例如，k1能够分析杨振宁手稿照片，解释其计算内容和可能的背景。这一能力引发了对图灵测试有效性的讨论，以及AI大模型进化对人类读者区分机器与用户的影响。

k1模型是基于k0-math模型的升级，后者在数学能力上表现出色，但仅限于LaTeX等格式的文本输入。k1模型通过端到端的图像理解能力，扩展了数学能力，包括几何题，并增加了物理、化学等基础科学能力。在基础教育的几何和图形题专项基准能力测试中，k1的表现与OpenAI的o1模型相当。

k1模型的推理能力在数理化能力上表现出色，结合了视觉识别与逻辑推理能力。它能够识别在强噪声干扰下拍摄的图片信息，包括灰暗灯光、阴影、书本弯折、模糊或虚化、手写字迹干扰等场景。在实际应用中，k1能够处理理工类图文信息识别，尤其是涉及公式与图形的问题。

k1模型的发布，不仅能够解读诺贝尔奖级别的科学家研究手稿，还能够处理复杂的数理化问题。这使得k1在多模态、推理和AI自我学习方面取得了进展，尤其是在多模态与推理的结合上，展现了月之暗面团队的创新能力。k1模型的推出，预示着月之暗面在AGI进阶之路上的又一重要步骤，同时也为国内的大模型发展带来了新的惊喜。