开源版o1！中国大模型让国外陷入疯狂，成本猛降90%

AIGC动态7个月前发布 AIGCOPEN

955 0 0

开源版o1！中国大模型让国外陷入疯狂，成本猛降90%

文章摘要

【关键词】 R1模型、性能优异、开源优势、低成本、推理能力

DeepSeek开源的R1模型在多个测试中表现优异，超越了OpenAI的o1模型。在美国AIME 2024测试中，R1得分79.8，高于o1的79.2分；在MATH-500中，R1得分97.3，同样超过o1的96.4分；在SWE-bench Verified中，R1得分49.2，超过o1的48.9分。尽管在Codeforces、MMLU和GPQA测试中R1略低于o1，但整体性能相当。价格方面，R1模型的成本远低于o1模型，输入成本降低了90%，输出成本降低了27倍。R1模型的开源地址为https://huggingface.co/deepseek-ai/R1，API地址为https://api-docs.deepseek.com/guides/reasoning_model。

DeepSeek R1模型的开源引起了国外网友的极大关注，他们对中国开源大模型的飞速发展感到不可思议，认为R1已经超过了Meta、Mistral等老牌开源平台。R1模型的性能与o1相当，且开源，可以用来蒸馏创建自己的模型。R1模型的低价和开源特性，使得OpenAI每月200美元的订阅优势不再明显。

R1模型基于R1-Zero模型改进而来，引入了冷启动数据和多阶段训练流程，提升了模型的推理能力和可读性。冷启动阶段使用少量高质量长CoT数据，为模型提供稳定优化的起点。R1的训练流程包括推理导向的强化学习、拒绝采样与监督微调、全场景强化学习三个阶段，通过逐步优化和调整，使模型在推理能力上达到更高水平，同时在其他任务上也表现出色。

R1模型的开源和低价特性，使其在国外迅速成为开源大模型界的顶流。苹果的机器学习研究员Awni Hannun测试了R1模型，发现在苹果M2 Ultra上运行推理效率相当快。有人体验了R1后表示，这是最像人类内心独白的模型，相当不错。FileDash.ai创始人Paul Couvert认为R1比Claude 3.5 Sonnet和o1-mini表现更出色，性能与o1几乎差不多。

原文和模型

【原文链接】 阅读原文 [ 2262字 | 10分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # 大模型 # R1模型 # 低成本 # 开源优势 # 性能优异 # 推理能力

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

实测OpenAI的o1：真没吹牛，奥数题高考题都能信手拈来了？

硅星人Pro

1,880

让OpenAI o1逆天的慢思考，360两月前就做出来了？周鸿祎CoE媲美CoT，应用太前瞻

新智元

2,201

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

新智元

2,339

对话宇树科技王兴兴，造出 9.9 万元人形机器人的 90 后偏才

admin

2,839

OpenAI发布o3/o4-mini两大推理模型，要把Agent吞进模型里了

硅星人Pro

1,363

不发 GPT-5、直接上 GPT-6？曝 OpenAI 新模型代号 Orion，目标“杀死”幻觉

AI前线

2,694

“极客训练营”

暂无评论

暂无评论...