大模型的中场战事:CoE or MoE ?

AIGC动态5个月前发布 geekpark
957 0 0
大模型的中场战事:CoE or MoE ?

 

文章摘要


【关 键 词】 产业整合技术挑战多模型分工CoE模型AI助手

大模型产业在2024年经历了快速的淘汰和整合,全球融资额从2023年一季度的216.9亿美元增长到258.7亿美元,但交易数量却从1909笔下滑至1545笔,显示出产业格局正迅速向头部企业集中。大厂的价格战使得新进入者面临巨大挑战,技术尚未走到尽头,产业侧已从萌芽到初定格局。然而,胜利者也面临更漫长的消耗战,GPU资源、模型参数膨胀速度和现金消耗速度等问题成为行业头顶的阴云。

大模型产业正陷入技术诅咒,绝对的大参数并非唯一解法。英伟达的Llama 3 405B参数模型在训练中频繁出现故障,显示出硬件已接近极限。细分场景中,智能程度不再与参数量成正比,商业化的不可能三角——智能程度、速度和成本——为参数扩张画上问号。行业开始转向寻求新的解题思路。

多模型联合分工成为行业第二阶段的主旋律。MoE(混合专家模型)和CoE(专家协同模型)成为两种不同的技术路线。MoE通过组合多个专家模型,虽然提高了样本效率,但设计和迭代成本巨大。CoE则通过意图识别和任务派解,实现更精准的分工和协同,具有更高的效率和更低的成本。

360集团副总裁梁志辉认为,CoE能够实现优势互补和真正的全能。360的AI助手Beta版通过CoE能力,已在多个单项能力测试指标上超越GPT-4o。360的CoE产品AI助手,通过意图识别和任务调度模型,实现了对用户意图的精准理解,以及对众多专家模型网络的智能调度。

360的AI助手在产品层面分为两部分:语料积累与算法技术依靠16家国产大模型的接入,而360则充当指挥官角色,实现精准的用户意图判断和任务调度。这背后的逻辑是,需求理解、语料积累和算法技术是决定用户感知智能程度的关键要素。360通过搜索引擎、浏览器等数据积累,能够更精准地拆解用户问题,实现更顺滑的用户体验。

360的AI助手作为独立应用和内置功能相结合,既提供更多场景,又创造更多可能。周鸿祎认为,大模型是能力而非产品,需要与场景结合才能产生价值。AI助手的集成到安全卫士、浏览器等产品中,实现了用户体验、场景连续、技术领先和产品生态的有机结合。

AI助手的商业模式实现了产品、技术和用户的三赢。通过CoE架构的意图识别和任务路由模型,问题可以精准分发匹配到最合适的模型回答,降低成本。同时,360旗下产品获得更多AI能力的加持,用户获得更精准的使用体验,大模型厂商获得免费流量和继续竞争的资格。

大模型产业在短短两年内经历了从初代产品到产业淘汰赛,再到商业化的快速进化。面对生存与伟大的终极之问,历史已经替参赛者做出回答:如果不能保证生存,伟大只会成为对手成功路上的垫脚石。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3897字 | 16分钟 ]
【原文作者】 极客公园
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...