开源版o1!中国大模型让国外陷入疯狂,成本猛降90%

AIGC动态19小时前发布 AIGCOPEN
36 0 0
开源版o1!中国大模型让国外陷入疯狂,成本猛降90%

 

文章摘要


【关 键 词】 R1模型性能优异开源优势低成本推理能力

DeepSeek开源的R1模型在多个测试中表现优异,超越了OpenAI的o1模型。在美国AIME 2024测试中,R1得分79.8,高于o1的79.2分;在MATH-500中,R1得分97.3,同样超过o1的96.4分;在SWE-bench Verified中,R1得分49.2,超过o1的48.9分。尽管在Codeforces、MMLU和GPQA测试中R1略低于o1,但整体性能相当。价格方面,R1模型的成本远低于o1模型,输入成本降低了90%,输出成本降低了27倍。R1模型的开源地址为https://huggingface.co/deepseek-ai/R1,API地址为https://api-docs.deepseek.com/guides/reasoning_model。

DeepSeek R1模型的开源引起了国外网友的极大关注,他们对中国开源大模型的飞速发展感到不可思议,认为R1已经超过了Meta、Mistral等老牌开源平台。R1模型的性能与o1相当,且开源,可以用来蒸馏创建自己的模型。R1模型的低价和开源特性,使得OpenAI每月200美元的订阅优势不再明显。

R1模型基于R1-Zero模型改进而来,引入了冷启动数据和多阶段训练流程,提升了模型的推理能力和可读性。冷启动阶段使用少量高质量长CoT数据,为模型提供稳定优化的起点。R1的训练流程包括推理导向的强化学习、拒绝采样与监督微调、全场景强化学习三个阶段,通过逐步优化和调整,使模型在推理能力上达到更高水平,同时在其他任务上也表现出色。

R1模型的开源和低价特性,使其在国外迅速成为开源大模型界的顶流。苹果的机器学习研究员Awni Hannun测试了R1模型,发现在苹果M2 Ultra上运行推理效率相当快。有人体验了R1后表示,这是最像人类内心独白的模型,相当不错。FileDash.ai创始人Paul Couvert认为R1比Claude 3.5 Sonnet和o1-mini表现更出色,性能与o1几乎差不多。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2262字 | 10分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...