全球首个人机交互端到端多模态大模型发布,RockAI CEO刘凡平:训推同步是自主学习的最佳方式|钛媒体AGI
文章摘要
【关 键 词】 多模态模型、智能机器人、群体智能、自研架构、训推同步
岩芯数智RockAI在上海发布了其最新升级的Yan 1.3大模型,这是全球首个端到端的多模态大模型,能够处理图文及语音等多模态信息,并适用于无人机、机器人、PC、手机等多种终端设备。RockAI的CEO刘凡平强调,Yan 1.3是全球首个跨越广泛设备的多模态大模型,也是国内自研的群体智能单元大模型。该模型已经在英伟达、高通等硬件设备上适配,以加速商业化进程。
RockAI成立于2023年6月,是岩山科技的子公司,专注于AIGC数智化服务。与基于Transformer架构的大模型不同,RockAI的Yan系列模型采用了非Transformer架构,通过MCSD机制替代了Transformer的Attention机制,从而降低了计算复杂度并提升了效率。Yan 1.3模型的发布,标志着RockAI在自研架构上超越了Llama3,成为中国自主架构大模型的里程碑。
在商业化方面,基于Yan 1.3的“胖虎”智能机器人展示了其多模态处理能力,能够在离线状态下识别环境、理解用户意图并执行任务。Yan系列模型也在无人机、手机、PC等设备上得到应用,如飞龙无人机,能够全面感知环境并在设备端实时处理数据。
刘凡平认为,RockAI的群体智能实现包括四个阶段:创新型基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。目前公司正处于第二阶段。此外,RockAI还发布了“训推同步”技术,旨在实现端侧设备上的实时学习和训练。
RockAI联合创始人陈代千宣布,公司将设立不少于1亿元人民币的创业基金,支持基于群体智能单元大模型的Yan生态的开发者、创业者和合作伙伴。
刘凡平在讨论中指出,虽然Transformer是通往通用人工智能的可能路径,但并非最优路径。他提倡大模型应该模拟人脑的工作方式,而非无时间差别的输出。他还提到,国内的大模型研发似乎陷入了“模式化”的困境,而Yan架构则证明了中国智慧的无限可能。
在对话中,刘凡平还讨论了Yan大模型的训推同步技术与OpenAI的强化学习的不同之处,以及如何在本地设备上进行训练。他预测,消费终端设备可能会出现大模型的爆发,并强调了模型学习过程的重要性,以及面向过程的学习对于增强模型可解释性的作用。他还提到,未来基于Transformer架构的通用大模型可能只剩下两三家,而群体智能单元大模型将更有意义。
原文和模型
【原文链接】 阅读原文 [ 2907字 | 12分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★