拾象科技李广密:对 DeepSeek 和智能下半场的几条判断
![拾象科技李广密:对 DeepSeek 和智能下半场的几条判断](https://www.xuexiaigc.com/wp-content/uploads/article-images/a2bfc8d280b27be940.png)
文章摘要
【关 键 词】 AI变革、开源模式、强化学习、算力需求、智能涌现
DeepSeek R1的出现标志着AI行业的新范式转变,其开源模式和低成本特性使其超越了Meta Llama,尽管与OpenAI、Anthropic和Google等第一梯队企业相比仍有差距。DeepSeek并未发明新范式,但其对RL(强化学习)和test time compute的推广,使得行业对这些技术的信心大增,吸引了更多研究者。Anthropic的技术路线与OpenAI存在分歧,认为基础模型与reasoning model应是连续光谱,而非独立的模型系列。
DeepSeek的成功并非偶然,其开源、低成本、联网和公开CoT等特点,为其赢得了市场的关注。然而,DeepSeek的轰动效应也受到了多种因素的影响,包括其在中国的起源、与美国科技霸主地位的挑战、以及在春节前的发布时机等。DeepSeek对不同市场参与者的影响各异,ToC领域的Chatbot受到冲击最大,而To Developer和To Enterprise的影响则较为有限。
在AI智能产业中,算力消耗是基础定律决定的,无论是探索智能还是应用智能,中长期的算力需求都会爆炸。DeepSeek的开源行动对推动AGI进程具有重要意义,加剧了竞争,推动了开放性。关于蒸馏技术是否能超越SOTA(State of the Art),如果DeepSeek在pre train阶段未使用蒸馏数据,其成果将更加惊艳。此外,智能技术的快速进步使得阶段性产品难以形成绝对壁垒,用户对更智能产品的忠诚度不高。
DeepSeek是否应该承接这波Chatbot流量并做大,考验着组织的精力和资源分配、组织能力和战略选择。同时,下一个智能突破的Aha moment可能来自第一梯队的下一代模型或Agent落地。在技术不确定性下,最宝贵的是天才AI researchers,任何想要探索AGI的组织都要投入资源更激进地探索下一个智能涌现的Aha moment。DeepSeek的成功让作者对中国AI人才更有信心,希望技术无国界。
原文和模型
【原文链接】 阅读原文 [ 3513字 | 15分钟 ]
【原文作者】 Founder Park
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆