「鲶鱼」DeepSeek 正在搅动上下游

AIGC动态5小时前发布 aitechtalk
42 0 0
「鲶鱼」DeepSeek 正在搅动上下游

 

文章摘要


【关 键 词】 DeepSeek大模型AI生态芯片适配推理服务

DeepSeek的出现引发了AI领域的剧烈震荡,其低成本、高效能的大模型训练和推理方式推动了开源潮流,并给整个行业带来了深远影响。通过引入MoE架构和FP8混合精度训练框架,DeepSeek大幅降低了模型训练和推理成本,这一创新不仅促使OpenAI等巨头调整策略,还令英伟达面临市场质疑,其市值在短期内显著下滑。与此同时,DeepSeek的普及激活了国内AI生态链的协同发展,从芯片厂商到云服务商均加速布局,共同探索降本增效的技术路径。

在国内,DeepSeek的应用迅速崛起,其APP上线后仅21天即成为全球增速最快的应用之一。大量用户涌入导致服务器压力激增,这对模型推理能力提出了更高要求,同时也为第三方推理服务提供了新机遇。国内外云厂商如微软、亚马逊、华为云等快速响应,推出了针对性优化方案。本地化部署中的技术难点,例如稀疏性优化和显存限制问题,正在被逐渐攻克,这进一步推动了国产算力的发展。

然而,国产芯片仍面临技术和生态上的挑战。尽管在推理领域国产芯片表现出一定优势,但在高性能训练场景下与英伟达仍有差距。英伟达依靠CUDA生态系统形成的技术壁垒,使得其在训练层面上难以替代。业内普遍认为,短期内国产算力更适合应用于推理场景,而非大规模训练任务。此外,DeepSeek的成功验证了低算力设备运行高质量模型的可能性,这一趋势将持续刺激市场需求,并激励全国产化的算力生态不断完善。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3470字 | 14分钟 ]
【原文作者】 AI科技评论
【摘要模型】 qwen-max-latest
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...