为什么中国只有一个 DeepSeek?
![为什么中国只有一个 DeepSeek?](https://www.xuexiaigc.com/wp-content/uploads/article-images/abc63d956677f77407.jpeg)
文章摘要
【关 键 词】 大模型、技术创新、资本错位、AGI追求、DeepSeek
在DeepSeek风暴过后,中国的大模型创业圈出现了两个极端:一边是热血沸腾的算力厂商与模型服务厂商,以及开源受益者;另一边则是其他中国大模型创业公司和投资这些公司的VC们,形成了“冰火两重天”的局面。部分VC团队开始接受内部“鞭尸”,质疑为何他们投资的大模型公司无法与低成本高成效的DeepSeek相匹敌。业界普遍在探讨“为什么没有成为DeepSeek”和“为什么中国只有一个DeepSeek”,这两个问题几乎涵盖了目前国内所有关于大模型创新的焦虑。
中国大模型的发展历史显示,2023年之前,中国只有4家大模型公司,而2023年之后,大模型创业公司增加到了十几家。这种增长的直接原因是Llama开源,但根本原因是市场认为大模型的技术门槛虽高,但并非不可模仿。在这种共识下,中国的第一批大模型技术探路者中,只有智谱一家成为了资本的宠儿,而其他如面壁智能等公司在资本市场的呼声远不如新势力。
市场对技术创新的敬畏之心变弱,导致中国的AI科技VC并没有沉下心来研究AGI技术,而是为了迅速上桌将钱投向了“曾打过胜仗的连续成功创业者”,哪怕这些团队此前没有大模型研发经历。这种现象导致没有技术能力的团队占据了大量资本资源,而有技术能力的团队却只能得到极少的资本资源,形成了系统性错位。
市场对技术缺乏敬畏之心的另一个影响是,过去两年中国大模型创业公司的目光从长期的AGI转到短期的商收、产品打磨上。这种打法的变化也是因为行业的误判,以为大模型再无创新之处。坚定追求AGI的创业者必须同时兼顾商业与技术,而对AGI产生怀疑或被市场声音迷惑的团队则要么放弃预训练、全面转向C端应用或干脆只基于开源模型微调行业大模型。
DeepSeek的成功展示了中国科技团队有能力做出引领世界AGI的创新,同时也体现了其在资金、人才/理想与组织文化上的优势。DeepSeek的团队规模小而精,大多数是原幻方Top2的技术高手,且招聘门槛非常高,体现了对人才的宁缺毋滥的态度。DeepSeek内部的组织文化扁平,梁文锋以下基本全是打工人,这种文化与宇树、Momenta等公司相似,都是技术发烧友,对技术有天然的敬畏之心与好奇之心。
DeepSeek的成功也改变了VC的看法,但更残酷的现实是,可能大批有过硬创新能力的团队因为融不到钱而倒在时代的前夜。商业化思维不仅反映在部分科技VC的影子中,其实也反映在研发人才的选择中。大厂与创业团队的分野已经形成,而大模型人才从创业团队流向大厂更是成为过去一年的普遍选择。
随着具身智能的发展,接下来AGI也天然分会分为云端AGI与端侧AGI。端侧AGI指的是天然能感知环境与进行做高阶推理,并能基于高阶推理做出复杂多步的决策的模型。要解决这些问题,除了资源,还要有强烈的技术实力与技术愿景。希望2025年,中国不再只有一个DeepSeek。
原文和模型
【原文链接】 阅读原文 [ 5338字 | 22分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★