拾象科技李广密：对 DeepSeek 和智能下半场的几条判断

1,566 0 0

文章摘要

DeepSeek R1的出现标志着AI行业的新范式转变，其开源模式和低成本特性使其超越了Meta Llama，尽管与OpenAI、Anthropic和Google等第一梯队企业相比仍有差距。DeepSeek并未发明新范式，但其对RL（强化学习）和test time compute的推广，使得行业对这些技术的信心大增，吸引了更多研究者。Anthropic的技术路线与OpenAI存在分歧，认为基础模型与reasoning model应是连续光谱，而非独立的模型系列。

DeepSeek的成功并非偶然，其开源、低成本、联网和公开CoT等特点，为其赢得了市场的关注。然而，DeepSeek的轰动效应也受到了多种因素的影响，包括其在中国的起源、与美国科技霸主地位的挑战、以及在春节前的发布时机等。DeepSeek对不同市场参与者的影响各异，ToC领域的Chatbot受到冲击最大，而To Developer和To Enterprise的影响则较为有限。

在AI智能产业中，算力消耗是基础定律决定的，无论是探索智能还是应用智能，中长期的算力需求都会爆炸。DeepSeek的开源行动对推动AGI进程具有重要意义，加剧了竞争，推动了开放性。关于蒸馏技术是否能超越SOTA（State of the Art），如果DeepSeek在pre train阶段未使用蒸馏数据，其成果将更加惊艳。此外，智能技术的快速进步使得阶段性产品难以形成绝对壁垒，用户对更智能产品的忠诚度不高。

DeepSeek是否应该承接这波Chatbot流量并做大，考验着组织的精力和资源分配、组织能力和战略选择。同时，下一个智能突破的Aha moment可能来自第一梯队的下一代模型或Agent落地。在技术不确定性下，最宝贵的是天才AI researchers，任何想要探索AGI的组织都要投入资源更激进地探索下一个智能涌现的Aha moment。DeepSeek的成功让作者对中国AI人才更有信心，希望技术无国界。