国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了

国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了

 

文章摘要


【关 键 词】 天工大模型逻辑推理开源PRM推理算法AI发展

近期,昆仑万维推出了国内首款具备中文逻辑推理能力的大模型——天工大模型4.0 o1版(Skywork o1),标志着公司在大模型及相关应用领域的又一重大进展。Skywork o1包含三款模型,其中开源版本的Skywork o1 Open参数为8B,在数学和代码指标上显著提升,并解锁了GPT-4o等更大量级模型无法完成的数学推理任务。此外,昆仑万维还开源了两个针对推理任务的Process-Reward-Model(PRM),分别是Skywork o1 Open-PRM-1.5B和Skywork o1 Open-PRM-7B,这两款PRM能够对模型回答中的每个步骤进行打分,是第一款适配代码类任务的开源PRM

Skywork o1 Lite具备完整的思考能力,推理与思考速度更快,在中文逻辑和推理、数学等问题上表现突出。Skywork o1 Preview则是完整版推理模型,搭配自研的线上推理算法,呈现出更多样和深度的思考过程,实现更完善和高质量的推理。昆仑万维表示,该系列模型在模型输出上内生了思考、计划和反思等能力,在慢思考中一步步地进行推理、反思与验证,解锁了“深思熟虑”等典型的进阶版复杂人类思考能力,确保了回答的质量和深度。

在实际测试中,Skywork o1系列模型在各种类型的推理问题上表现出色,无论是简单的比大小、数数问题,还是脑筋急转弯、常识推理、数学推理等复杂问题,都能给出正确的答案和完整的思考过程。这表明Skywork o1在逻辑推理任务上的性能大幅提升,得益于昆仑万维自研的三阶段训练方案:推理反思能力训练、推理能力强化学习、推理planning。这些技术的应用,使得Skywork o1在MATH数据集上的准确率达到55.4%,超越了Gemini Ultra。

昆仑万维自2020年起持续加码AI大模型投入,在基础技术层面构建起“算力基础设施—大模型算法—AI应用”的全产业链布局。随着天工大模型的不断升级和优化,昆仑万维在竞争激烈的生成式AI领域逐渐站稳了一席之地。期待昆仑万维未来能带来更多、更强大的技术,推动AI时代的发展。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3545字 | 15分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...