机器人端侧模型的十字路口
文章摘要
【关 键 词】 人工智能、机器人技术、大模型应用、算力瓶颈、端云协作
自2023年以来,人工智能领域的大模型和机器人技术成为科技发展的两大驱动力。大模型在提升机器人智能水平方面扮演着关键角色,尤其在泛化和规划能力上。然而,大模型在机器人领域的实际应用仍处于初级阶段,主要帮助机器人进行简单的任务理解和拆分。机器人厂商、大模型厂商和芯片厂商之间形成了复杂的三角关系,这种关系影响了技术的进一步发展。
机器人厂商主要分为身体控制派和交互感知派,技术源头多样,包括视觉感知、强化学习和语言模型等。大模型派在机器人领域的落地面临挑战,因为端侧模型需要适配芯片,而芯片迭代基于市场需求。目前,机器人市场尚未从专业级产品转向消费级产品,导致适配机器人端侧模型的芯片开发缓慢。此外,机器人消费市场的扩大依赖于智能水平的提升,即AI模型的迭代,而这又需要大量真实世界的高质量数据。
大模型在机器人领域的应用面临多个挑战,包括行业尚未找到适合机器人的模型框架、不同形态的机器人对大模型有不同的要求、不同的输入方式对大模型构成挑战,以及数据获取困难。模型厂商难以获取大量多元化的预训练数据,限制了模型执行任务的泛化性。
算力也是机器人端模型发展的关键瓶颈。国内研究基础大模型的主力军仍在关注云端大模型,而机器人搭载的板卡算力有限,难以运行千亿参数规模的大模型。这导致云端模型无法在机器人本体上离线部署,增加了成本和功耗问题。
为了打破这一僵局,需要三方合力。一些大模型厂商提出了解决方案,如端云协作的大小模型协同训练和部署方式,以及基于非Transformer架构的模型以降低算力要求和功耗。同时,芯片厂商需要实现高端芯片的突破,提高算力和降低功耗,以支持模型的更多机会。
最终,解决出货量问题是关键。机器人厂商需要提高本体的稳定性和适应性,覆盖多种场景。如果出货量得到提升,场景增多,上游厂商和资源自然会涌入。同时,机器人侧大模型的创业空间较大,因为机器人的主要交互方式是语音和视觉,核心诉求是实现拟人化。长期来看,模型厂商、芯片厂商与机器人厂商都有很大的探索提升空间,需要三方积极向彼此靠拢,并有一方主动破局。
原文和模型
【原文链接】 阅读原文 [ 6438字 | 26分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★