文章摘要
【关 键 词】 AI业务、10亿Tokens、AI应用、云原生、GPU集群
在大模型时代,日均10亿Tokens消耗量成为中国企业AI业务跑通的基本标准,至少200家中国企业达到这一标准,覆盖多个领域。这一标准意味着企业在垂直领域找到应用场景,证明了其商业模式的价值。以作业帮的Question.AI为例,其单日消耗Tokens接近10亿规模,而AI陪聊赛道的筑梦岛单日Tokens消耗量也超过10亿。在终端场景,如AI手机,Tokens消耗方式更加多元。云厂商披露的Tokens调用量和合作客户情况也为此提供了参考,如腾讯混元、百度文心大模型和豆包大模型的日均调用量均达到千亿级别。
这些“10亿Tokens俱乐部成员”在2024年的表现也为这一价值红线提供了有力参考。例如,作业帮的AI业务成为拉动增长的关键贡献,金山云的AI相关客户收入增长显著,OPPO的AI手机用户数量接近5000万。火山引擎谭待预测,五年后企业日均Tokens消耗可能达到几百万亿,尤其在多模态大模型推出后,各场景内都会有Agent助理跟随,带来很大的消耗量。
从应用落地角度来看,Agent趋势愈加明显,AI原生应用开始发力。OpenAI CEO奥特曼预测,2025年人工智能代理将实质性地改变公司的产出。量子位智库观测到AI智能助手APP在过去一年中增长明显,新增用户规模超过3.5亿。企业侧的增长也更早发生,Agent开发平台成为云厂商增长最快的企服产品之一。
供给方面,2024年云计算领域最显化的现象是“价格战”,背后是算力成本还在进一步优化,云厂商可以继续“以价换量”,推动AI应用落地趋势。行业公认,未来的计算范式应该以GPU为核心。火山引擎推出了AI云原生方案,支持大规模GPU集群弹性调度管理,专为AI推理设计。
综上所述,单个企业日均10亿Tokens消耗成为一条非常有价值的参考线,代表大模型应用落地新趋势,成为大模型应用落地新阶段的门槛,同时也是大模型落地“入门级水准”。随着这一新价值基准形成,谁能成为大模型落地的“独角兽”将更清晰。
原文和模型
【原文链接】 阅读原文 [ 3367字 | 14分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★