拾象科技李广密:对 DeepSeek 和智能下半场的几条判断

AI-Agent14小时前发布 Founder Park
56 0 0
拾象科技李广密:对 DeepSeek 和智能下半场的几条判断

 

文章摘要


【关 键 词】 AI变革开源模式强化学习算力需求智能涌现

DeepSeek R1的出现标志着AI行业的新范式转变,其开源模式和低成本特性使其超越了Meta Llama,尽管与OpenAI、Anthropic和Google等第一梯队企业相比仍有差距。DeepSeek并未发明新范式,但其对RL(强化学习)和test time compute的推广,使得行业对这些技术的信心大增,吸引了更多研究者。Anthropic的技术路线与OpenAI存在分歧,认为基础模型与reasoning model应是连续光谱,而非独立的模型系列。

DeepSeek的成功并非偶然,其开源、低成本、联网和公开CoT等特点,为其赢得了市场的关注。然而,DeepSeek的轰动效应也受到了多种因素的影响,包括其在中国的起源、与美国科技霸主地位的挑战、以及在春节前的发布时机等。DeepSeek对不同市场参与者的影响各异,ToC领域的Chatbot受到冲击最大,而To Developer和To Enterprise的影响则较为有限。

在AI智能产业中,算力消耗是基础定律决定的,无论是探索智能还是应用智能,中长期的算力需求都会爆炸。DeepSeek的开源行动对推动AGI进程具有重要意义,加剧了竞争,推动了开放性。关于蒸馏技术是否能超越SOTA(State of the Art),如果DeepSeek在pre train阶段未使用蒸馏数据,其成果将更加惊艳。此外,智能技术的快速进步使得阶段性产品难以形成绝对壁垒,用户对更智能产品的忠诚度不高。

DeepSeek是否应该承接这波Chatbot流量并做大,考验着组织的精力和资源分配、组织能力和战略选择。同时,下一个智能突破的Aha moment可能来自第一梯队的下一代模型或Agent落地。在技术不确定性下,最宝贵的是天才AI researchers,任何想要探索AGI的组织都要投入资源更激进地探索下一个智能涌现的Aha moment。DeepSeek的成功让作者对中国AI人才更有信心,希望技术无国界。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3513字 | 15分钟 ]
【原文作者】 Founder Park
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...