为什么中国只有一个 DeepSeek？

1,607 0 0

文章摘要

在DeepSeek风暴过后，中国的大模型创业圈出现了两个极端：一边是热血沸腾的算力厂商与模型服务厂商，以及开源受益者；另一边则是其他中国大模型创业公司和投资这些公司的VC们，形成了“冰火两重天”的局面。部分VC团队开始接受内部“鞭尸”，质疑为何他们投资的大模型公司无法与低成本高成效的DeepSeek相匹敌。业界普遍在探讨“为什么没有成为DeepSeek”和“为什么中国只有一个DeepSeek”，这两个问题几乎涵盖了目前国内所有关于大模型创新的焦虑。

中国大模型的发展历史显示，2023年之前，中国只有4家大模型公司，而2023年之后，大模型创业公司增加到了十几家。这种增长的直接原因是Llama开源，但根本原因是市场认为大模型的技术门槛虽高，但并非不可模仿。在这种共识下，中国的第一批大模型技术探路者中，只有智谱一家成为了资本的宠儿，而其他如面壁智能等公司在资本市场的呼声远不如新势力。

市场对技术创新的敬畏之心变弱，导致中国的AI科技VC并没有沉下心来研究AGI技术，而是为了迅速上桌将钱投向了“曾打过胜仗的连续成功创业者”，哪怕这些团队此前没有大模型研发经历。这种现象导致没有技术能力的团队占据了大量资本资源，而有技术能力的团队却只能得到极少的资本资源，形成了系统性错位。

市场对技术缺乏敬畏之心的另一个影响是，过去两年中国大模型创业公司的目光从长期的AGI转到短期的商收、产品打磨上。这种打法的变化也是因为行业的误判，以为大模型再无创新之处。坚定追求AGI的创业者必须同时兼顾商业与技术，而对AGI产生怀疑或被市场声音迷惑的团队则要么放弃预训练、全面转向C端应用或干脆只基于开源模型微调行业大模型。

DeepSeek的成功展示了中国科技团队有能力做出引领世界AGI的创新，同时也体现了其在资金、人才/理想与组织文化上的优势。DeepSeek的团队规模小而精，大多数是原幻方Top2的技术高手，且招聘门槛非常高，体现了对人才的宁缺毋滥的态度。DeepSeek内部的组织文化扁平，梁文锋以下基本全是打工人，这种文化与宇树、Momenta等公司相似，都是技术发烧友，对技术有天然的敬畏之心与好奇之心。

DeepSeek的成功也改变了VC的看法，但更残酷的现实是，可能大批有过硬创新能力的团队因为融不到钱而倒在时代的前夜。商业化思维不仅反映在部分科技VC的影子中，其实也反映在研发人才的选择中。大厂与创业团队的分野已经形成，而大模型人才从创业团队流向大厂更是成为过去一年的普遍选择。

随着具身智能的发展，接下来AGI也天然分会分为云端AGI与端侧AGI。端侧AGI指的是天然能感知环境与进行做高阶推理，并能基于高阶推理做出复杂多步的决策的模型。要解决这些问题，除了资源，还要有强烈的技术实力与技术愿景。希望2025年，中国不再只有一个DeepSeek。