标签:开源模型

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

阶跃星辰与清华大学联合发布的Open Reasoner Zero(ORZ)模型在强化学习训练方法上取得突破性进展。该研究采用极简主义方法,仅使用带有GAE的原版PPO算法和基...

一天开源五个模型,AI 热潮将加速今年中国智算规模增长43%|钛媒体AGI

阶跃星辰与吉利汽车集团联合宣布开源两款多模态大模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互模型Step-Audio。Step-...

百度决定背叛闭源大模型,李彦宏重新拥抱开源

百度宣布将于2024年6月30日起逐步开源文心大模型4.5系列,标志着其战略从闭源收费向开源开放的转变。这一决策发生在DeepSeek引发行业冲击的背景下,距离百度...

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

斯坦福大学、加州大学伯克利分校等机构联合发布了开源推理模型OpenThinker-32B,其性能接近当前最先进的DeepSeek-R1-32B模型。该模型仅使用114k训练数据(相...

淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1

淘宝和拼多多等平台上出现大量倒卖DeepSeek模型资源的商家,将本可免费获取的安装包、教程等资料以10-100元不等的价格出售,部分商品成交量达上千单。这种现...

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

一种名为Huginn的新型开源推理大模型架构通过在连续高维潜空间中直接操作隐藏状态,突破了传统长思维链推理范式的限制。该模型由马克思普朗克研究所和马里兰...

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

DeepSeek-R1模型的开源引发了全球技术社区对模型复现的热潮,其中Hugging Face主导的Open R1项目成为焦点。该项目通过公开训练代码、评估工具和合成数据集,...

2月15日,探讨DeepSeek开源模型引发的AI最新趋势!蒸馏经验/开源生态/工程能力提升|嘉程创业流水席第249期

DeepSeek开源模型通过技术创新与生态合作,正在重塑AI行业格局。其核心突破源于2024年12月发布的DeepSeek-V3版本,创新性融合FP8运算、MLA注意力机制与MoE架...

清华大学刘知远详解DeepSeek:OpenAI引爆o1藏秘方,但R1造出原子弹也能公开方法|钛媒体AGI

清华大学刘知远副教授在CCF青年论坛直播中深入剖析了DeepSeek R1模型的技术突破与行业影响。该模型通过开源方式完整复现OpenAI o1的深度推理能力,成为全球首...

火遍全球的DeepSeek:科学家是怎么用它的?

中国公司推出的开源人工智能模型DeepSeek-R1因其性价比优势和强大推理能力引发全球科研界关注。这款平价的推理模型在数学与科学问题处理能力上与OpenAI的闭源...
1 2 3