聊了一百位硅谷大模型从业者后，我们对 AGI 投资产生了新的思考

AI-Agent1年前 (2024)发布 aitechtalk

2,992 0 0

文章摘要

大模型行业目前正处于发展的初期阶段，类似于“前浏览器或前IOS时代”，存在一定的泡沫现象。尽管OpenAI的年经常性收入（ARR）达到了41亿美元，但其背后是高昂的算力、研发和运营成本。今年以来，OpenAI经历了多位核心高管的离职，包括联合创始人和首席技术官，同时苹果退出了其最新一轮融资谈判。华映资本认为，只有当GPT技术真正赋能所有上层垂直行业应用场景，实现大规模落地实践和平台化商业化，才能标志着LLM浪潮的全面到来。然而，目前GPT更像是一个超级APP，而非底层平台，其插件和GPTs未能简单复制IOS的App Store模式。

大模型行业面临的挑战包括应用方数据难以整合，这是GPT平台型商业化的底层制约。AI领域的投资人和创业者主要分为两个流派：应用场景派和底层技术派。应用场景派关注垂直行业大模型的商业化，而底层技术派则聚焦于底座大模型，认为未来一切都由AI平台驱动。这两派都面临着各自的挑战，如预测LLM推动应用场景爆发的底层驱动力、应用的全面爆发所需的里程碑，以及上层应用的缺乏和数据闭环的无法形成。

AI产业化的本质在于深度学习算法的大规模应用，这是“产业化AI”的本质，也是“数据定义生产力”的开始。然而，这也制造了极高的门槛和困局。自称“AI驱动”的企业必须拥有足够的私有数据，才能形成足够的护城河。但数据的双刃剑特性也给企业带来了挑战，如数据的来源、清洗成本、以及如何将数据训练进入垂直模型以推动底座模型在垂直领域提高能力。

大模型的应用场景客户类型包括C端终端用户、B端终端客户、B端服务实施公司和纯商业化产品公司。前三类应用场景已经实现了不错的效果和商业化，但这些并不能支撑LLM需要完成的平台性商业化生态。只有当第四类公司大规模出现后，LLM的平台性质的商业化才能真正爆发。然而，目前从这类AI原生应用公司的终端客户的使用度上判断，并没有看到规模化的迹象，因此业界不断有“大模型是否到了瓶颈或者泡沫化”的讨论。

垂直行业企业的私有数据尚未被充分利用，这些数据是否有效获得充分利用，将极为关键。当前几种私有数据的主流运用方法，如提示词工程、RAG（检索增强生成）、微调和Agent，都面临着技术门槛高、成本高昂和效果不确定的挑战。企业私有数据无法完全参与底座大模型的继续训练，是造成“数据不足”困境的重要原因。

算力困局也是大模型行业面临的挑战之一。为打破英伟达显卡带来的高额算力成本投入的僵局，许多下游行业玩家推出了“垂直行业小模型”或者“端侧小模型”，但这些小模型的起点和核心价值仍在大模型上。产业实践中还存在其他类型的小模型，如基于非GPT或非Transformer架构的模型网络，以及其他更传统的非深度学习、甚至基于规则的“模型”。

潜在的破局方案可能包括借鉴互联网时代的思考，大模型时代和互联网时代类似，也会经历三个发展阶段：B/C端用户直接使用大模型、出现各种垂直整合的大模型商业化应用、上层商业化应用和底层平台充分解耦，落地应用爆发，底座模型规模性变现。当前我们处在的是“阶段一”已经完成、“阶段二”刚刚开始的过渡时期。短期投资策略可能聚焦于“垂直整合应用”公司，这类公司具备底座大模型算法能力，但放弃做通用底层平台的端到端的垂直整合应用。