全球首个人机交互端到端多模态大模型发布，RockAI CEO刘凡平：训推同步是自主学习的最佳方式｜钛媒体AGI

2,904 0 0

文章摘要

岩芯数智RockAI在上海发布了其最新升级的Yan 1.3大模型，这是全球首个端到端的多模态大模型，能够处理图文及语音等多模态信息，并适用于无人机、机器人、PC、手机等多种终端设备。RockAI的CEO刘凡平强调，Yan 1.3是全球首个跨越广泛设备的多模态大模型，也是国内自研的群体智能单元大模型。该模型已经在英伟达、高通等硬件设备上适配，以加速商业化进程。

RockAI成立于2023年6月，是岩山科技的子公司，专注于AIGC数智化服务。与基于Transformer架构的大模型不同，RockAI的Yan系列模型采用了非Transformer架构，通过MCSD机制替代了Transformer的Attention机制，从而降低了计算复杂度并提升了效率。Yan 1.3模型的发布，标志着RockAI在自研架构上超越了Llama3，成为中国自主架构大模型的里程碑。

在商业化方面，基于Yan 1.3的“胖虎”智能机器人展示了其多模态处理能力，能够在离线状态下识别环境、理解用户意图并执行任务。Yan系列模型也在无人机、手机、PC等设备上得到应用，如飞龙无人机，能够全面感知环境并在设备端实时处理数据。

刘凡平认为，RockAI的群体智能实现包括四个阶段：创新型基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。目前公司正处于第二阶段。此外，RockAI还发布了“训推同步”技术，旨在实现端侧设备上的实时学习和训练。

RockAI联合创始人陈代千宣布，公司将设立不少于1亿元人民币的创业基金，支持基于群体智能单元大模型的Yan生态的开发者、创业者和合作伙伴。

刘凡平在讨论中指出，虽然Transformer是通往通用人工智能的可能路径，但并非最优路径。他提倡大模型应该模拟人脑的工作方式，而非无时间差别的输出。他还提到，国内的大模型研发似乎陷入了“模式化”的困境，而Yan架构则证明了中国智慧的无限可能。

在对话中，刘凡平还讨论了Yan大模型的训推同步技术与OpenAI的强化学习的不同之处，以及如何在本地设备上进行训练。他预测，消费终端设备可能会出现大模型的爆发，并强调了模型学习过程的重要性，以及面向过程的学习对于增强模型可解释性的作用。他还提到，未来基于Transformer架构的通用大模型可能只剩下两三家，而群体智能单元大模型将更有意义。