什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的

AIGC动态8小时前发布 QbitAI
69 0 0
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的

 

文章摘要


【关 键 词】 推理模型多模态开源成本效益落地应用

阶跃星辰在WAIC期间发布的新一代基础大模型Step 3,填补了市场对兼具多模态能力、强推理性能、低成本及开源特性的模型需求空缺。该模型总参数达321B,采用MoE架构,激活参数38B,包含独立的视觉编码器和语言模型。Step 3在MMMU等多模态榜单上取得开源模型新SOTA成绩,同时通过系统协同设计显著降低推理成本,解码效率最高可达同类模型的300%。

模型的核心优势体现在“多开好省”四字策略中。“多”指其原生多模态能力,能处理跨领域复杂知识分析和日常视觉任务,例如根据服装标签结合用户体征提供穿搭建议。“开”表现为7月31日全面开源的承诺,打破强模型闭源的行业惯例。“好”强调严谨的逻辑推理能力,例如通过WAIC现场图片识别机器人拳击场景并推断展会背景。“省”则通过AFD分布式推理系统和MFA注意力机制两项创新实现:前者拆分Attention与FNN计算任务以优化资源分配,后者通过低秩设计降低KV缓存需求,最终使Step 3在A800芯片上的成本仅为DeepSeek-V3的30%。

落地层面,阶跃联合近10家芯片厂商成立“模芯生态创新联盟”,推动国产硬件适配。华为昇腾等已实现完整多模态能力部署,解决API价格战之外的算力瓶颈。终端应用覆盖汽车、手机等场景:吉利银河M9首发搭载端到端语音大模型,OPPO等Top10手机厂商过半接入多模态功能,实现本地化AI伴聊和记忆管理。商业化进展显著,2025年预计收入达10亿人民币,验证了技术到产业的闭环能力。

Step 3的发布标志着推理模型竞争进入新阶段——从参数指标转向实际部署价值。其系统级创新不仅重新定义SOTA标准,更通过芯片友好设计、终端场景渗透和生态协同,为行业提供了兼具技术前瞻性与商业可行性的范本。当多数厂商仍聚焦榜单排名时,阶跃已通过“能用、好用、用得起的模型”在汽车座舱、智能手机等高频场景建立起差异化壁垒,成为基础模型赛道中少数实现规模收入的玩家。

原文和模型


【原文链接】 阅读原文 [ 3361字 | 14分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...