国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

AIGC动态10个月前发布 almosthuman2014

1,923 0 0

文章摘要

近期，昆仑万维推出了国内首款具备中文逻辑推理能力的大模型——天工大模型4.0 o1版（Skywork o1），标志着公司在大模型及相关应用领域的又一重大进展。Skywork o1包含三款模型，其中开源版本的Skywork o1 Open参数为8B，在数学和代码指标上显著提升，并解锁了GPT-4o等更大量级模型无法完成的数学推理任务。此外，昆仑万维还开源了两个针对推理任务的Process-Reward-Model（PRM），分别是Skywork o1 Open-PRM-1.5B和Skywork o1 Open-PRM-7B，这两款PRM能够对模型回答中的每个步骤进行打分，是第一款适配代码类任务的开源PRM。

Skywork o1 Lite具备完整的思考能力，推理与思考速度更快，在中文逻辑和推理、数学等问题上表现突出。Skywork o1 Preview则是完整版推理模型，搭配自研的线上推理算法，呈现出更多样和深度的思考过程，实现更完善和高质量的推理。昆仑万维表示，该系列模型在模型输出上内生了思考、计划和反思等能力，在慢思考中一步步地进行推理、反思与验证，解锁了“深思熟虑”等典型的进阶版复杂人类思考能力，确保了回答的质量和深度。

在实际测试中，Skywork o1系列模型在各种类型的推理问题上表现出色，无论是简单的比大小、数数问题，还是脑筋急转弯、常识推理、数学推理等复杂问题，都能给出正确的答案和完整的思考过程。这表明Skywork o1在逻辑推理任务上的性能大幅提升，得益于昆仑万维自研的三阶段训练方案：推理反思能力训练、推理能力强化学习、推理planning。这些技术的应用，使得Skywork o1在MATH数据集上的准确率达到55.4%，超越了Gemini Ultra。

昆仑万维自2020年起持续加码AI大模型投入，在基础技术层面构建起“算力基础设施—大模型算法—AI应用”的全产业链布局。随着天工大模型的不断升级和优化，昆仑万维在竞争激烈的生成式AI领域逐渐站稳了一席之地。期待昆仑万维未来能带来更多、更强大的技术，推动AI时代的发展。