国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型

AIGC动态6小时前发布 AIGCOPEN
33 0 0
国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型

 

文章摘要


【关 键 词】 开源模型平台数据强化学习训练优化AI突破

Huggingface平台最新数据显示,中国开源大模型DeepSeek-R1以超过1万点赞量和1000万次下载量,成为该平台有史以来最受欢迎的开源模型。这一成绩仅用数周时间便超越了Meta的Llama系列、微软Phi系列、谷歌Gemma系列等国际知名模型,甚至领先于文生图领域的FLUX.1和Stable-Diffusion系列。平台联合创始人Clement Delangue多次公开肯定其表现,社区评价其“彻底改变了AI领域的竞争格局”。

DeepSeek-R1的技术突破源于四阶段训练框架。冷启动阶段通过收集数千条长思维链数据,对基础模型进行微调,解决了传统强化学习初期的不稳定性问题。推理导向强化学习阶段聚焦数学、编码等任务,创新性地引入语言一致性奖励机制,将目标语言单词比例纳入评估体系,在保持性能的同时显著提升输出的可读性。拒绝采样阶段则扩展数据多样性,融合写作、角色扮演等通用任务数据,增强模型多场景适应能力。最终的全场景强化学习阶段通过混合规则奖励与奖励模型,同步优化模型的有用性、无害性及推理能力,建立覆盖响应全流程的安全评估体系。

市场影响方面,DeepSeek-R1的成功已对闭源模型构成实质性挑战。包括AWS、Azure在内的云服务平台更倾向采用该开源方案,而非其投资的Sonar或Anthropic模型。技术层面,其训练框架展现出三大核心创新:基于人工标注优化的冷启动数据构建方法、面向多语言场景的动态奖励机制,以及分离式评估体系——对推理任务仅评估最终结论的实用性,而对安全性则实施全响应内容审查。随着DeepSeek宣布即将发布新功能,开源社区正期待其进一步推动大模型技术的普惠化进程。

原文和模型


【原文链接】 阅读原文 [ 1326字 | 6分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek-r1
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...