国外权威认证！DeepSeek超150万模型，成最受欢迎开源大模型

1,498 0 0

文章摘要

Huggingface平台最新数据显示，中国开源大模型DeepSeek-R1以超过1万点赞量和1000万次下载量，成为该平台有史以来最受欢迎的开源模型。这一成绩仅用数周时间便超越了Meta的Llama系列、微软Phi系列、谷歌Gemma系列等国际知名模型，甚至领先于文生图领域的FLUX.1和Stable-Diffusion系列。平台联合创始人Clement Delangue多次公开肯定其表现，社区评价其“彻底改变了AI领域的竞争格局”。

DeepSeek-R1的技术突破源于四阶段训练框架。冷启动阶段通过收集数千条长思维链数据，对基础模型进行微调，解决了传统强化学习初期的不稳定性问题。推理导向强化学习阶段聚焦数学、编码等任务，创新性地引入语言一致性奖励机制，将目标语言单词比例纳入评估体系，在保持性能的同时显著提升输出的可读性。拒绝采样阶段则扩展数据多样性，融合写作、角色扮演等通用任务数据，增强模型多场景适应能力。最终的全场景强化学习阶段通过混合规则奖励与奖励模型，同步优化模型的有用性、无害性及推理能力，建立覆盖响应全流程的安全评估体系。

市场影响方面，DeepSeek-R1的成功已对闭源模型构成实质性挑战。包括AWS、Azure在内的云服务平台更倾向采用该开源方案，而非其投资的Sonar或Anthropic模型。技术层面，其训练框架展现出三大核心创新：基于人工标注优化的冷启动数据构建方法、面向多语言场景的动态奖励机制，以及分离式评估体系——对推理任务仅评估最终结论的实用性，而对安全性则实施全响应内容审查。随着DeepSeek宣布即将发布新功能，开源社区正期待其进一步推动大模型技术的普惠化进程。