标签:开源模型
HuggingFace上的热门开源模型,一半都来自中国了
在最新的HuggingFace热门模型榜单中,中国模型的占比超过了50%,包括QwQ-32B、HunyuanVideo-12V、DeepSeekR1等知名模型。这一现象不仅体现了中国在开源模型领...
智谱开源AI绘图CogView4,曾经的开源之光回来了。
近日,智谱与清华团队正式开源了AI绘图模型CogView4,成为首个支持中英文字直接生成的开源图像生成模型。该模型基于6B参数规模,支持最高2048像素分辨率的图...
DeepSeek开源打碎了谁的饭碗
DeepSeek的开源策略正在重塑中国AI产业生态,中腰部AI应用公司、芯片企业和硬件厂商成为首批受益者。53AI创始人杨芳贤透露,其半数存量客户已将基座模型切换...
国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型
Huggingface平台最新数据显示,中国开源大模型DeepSeek-R1以超过1万点赞量和1000万次下载量,成为该平台有史以来最受欢迎的开源模型。这一成绩仅用数周时间便...
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
阶跃星辰与清华大学联合发布的Open Reasoner Zero(ORZ)模型在强化学习训练方法上取得突破性进展。该研究采用极简主义方法,仅使用带有GAE的原版PPO算法和基...
一天开源五个模型,AI 热潮将加速今年中国智算规模增长43%|钛媒体AGI
阶跃星辰与吉利汽车集团联合宣布开源两款多模态大模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互模型Step-Audio。Step-...
百度决定背叛闭源大模型,李彦宏重新拥抱开源
百度宣布将于2024年6月30日起逐步开源文心大模型4.5系列,标志着其战略从闭源收费向开源开放的转变。这一决策发生在DeepSeek引发行业冲击的背景下,距离百度...
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型
斯坦福大学、加州大学伯克利分校等机构联合发布了开源推理模型OpenThinker-32B,其性能接近当前最先进的DeepSeek-R1-32B模型。该模型仅使用114k训练数据(相...
淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1
淘宝和拼多多等平台上出现大量倒卖DeepSeek模型资源的商家,将本可免费获取的安装包、教程等资料以10-100元不等的价格出售,部分商品成交量达上千单。这种现...
推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
一种名为Huginn的新型开源推理大模型架构通过在连续高维潜空间中直接操作隐藏状态,突破了传统长思维链推理范式的限制。该模型由马克思普朗克研究所和马里兰...