「鲶鱼」DeepSeek 正在搅动上下游

1,543 0 0

文章摘要

DeepSeek的出现引发了AI领域的剧烈震荡，其低成本、高效能的大模型训练和推理方式推动了开源潮流，并给整个行业带来了深远影响。通过引入MoE架构和FP8混合精度训练框架，DeepSeek大幅降低了模型训练和推理成本，这一创新不仅促使OpenAI等巨头调整策略，还令英伟达面临市场质疑，其市值在短期内显著下滑。与此同时，DeepSeek的普及激活了国内AI生态链的协同发展，从芯片厂商到云服务商均加速布局，共同探索降本增效的技术路径。

在国内，DeepSeek的应用迅速崛起，其APP上线后仅21天即成为全球增速最快的应用之一。大量用户涌入导致服务器压力激增，这对模型推理能力提出了更高要求，同时也为第三方推理服务提供了新机遇。国内外云厂商如微软、亚马逊、华为云等快速响应，推出了针对性优化方案。本地化部署中的技术难点，例如稀疏性优化和显存限制问题，正在被逐渐攻克，这进一步推动了国产算力的发展。

然而，国产芯片仍面临技术和生态上的挑战。尽管在推理领域国产芯片表现出一定优势，但在高性能训练场景下与英伟达仍有差距。英伟达依靠CUDA生态系统形成的技术壁垒，使得其在训练层面上难以替代。业内普遍认为，短期内国产算力更适合应用于推理场景，而非大规模训练任务。此外，DeepSeek的成功验证了低算力设备运行高质量模型的可能性，这一趋势将持续刺激市场需求，并激励全国产化的算力生态不断完善。