超6.4亿次下载!智源发布具身大脑等五大新技术,王仲远:具身智能的淘汰赛还没开始

文章摘要
第七届智源大会于6月6日在北京召开,北京智源人工智能研究院发布了“悟界”系列大模型,标志着AI技术从数字世界向物理世界的加速迈进。这一系列包括原生多模态世界模型Emu3、跨本体具身大小脑协作框架RoboOS 2.0与全新智源具身大脑RoboBrain 2.0、全球首个脑科学多模态通用基础模型见微Brainμ以及全原子微观生命模型OpenComplex2。“悟界”系列大模型承载的是智源对AI从数字世界迈向物理世界的技术趋势的判断。智源研究院院长王仲远指出,当前AI大模型技术还远未到发展尽头,多模态数据的有效利用是实现物理AGI的重要路径。
具身智能是本次大会的重要议题之一。王仲远强调,具身智能并不局限于人形机器人,而是可以适配多种机器人类别。“具身智能的‘小组赛’还没结束,远没有到‘淘汰赛’。”他认为,未来机器人将首先在特定场景中落地,尤其是在工厂等封闭环境中完成固定、重复或危险的任务,这将是具身智能的第一波红利。然而,当前人形机器人的硬件和模型均未成熟,技术路径尚未明确,数据采集困难,软硬件协同复杂,产业落地周期较长。“未来5-10年,大小脑融合的模型可能会成熟,但不是今天。”
智源研究院自2018年成立以来,致力于AI创新,累计孵化加速了10余家具有核心技术能力的AI创新企业,估值超过百亿的有1家,超过十亿的有5家。“实践证明,我们对于技术演进路径预判的正确性。”智源通过多种研发方式,利用原生多模态世界模型,让AI感知和理解物理世界,并进行交互。在宏观层面,大模型与硬件结合,通过具身智能的发展解决实际生产生活问题;在微观层面,基于生成式AI的蛋白质、脑机接口等应用,进一步揭示微观世界的本质。
多模态技术是AI发展的另一大方向。王仲远指出,多模态数据是文字数据的百倍、千倍乃至万倍,这些数据远未被有效利用。“多模态技术路线还没有收敛,文生图、文生视频走的是Transformer+Diffusion的技术路线,比较确定,能力不断提升,在某些特定场景已落地。”智源开源模型全球总下载量超6.4亿次,AI系统软件栈FlagOS对11家国内外厂商18款AI芯片已统一支持,开源超160个数据集,下载量近113万次,开源项目代码下载量超140万次。
此外,智源研究院与北京大学第一医院签署战略合作协议,并与香港投资管理有限公司建立战略合作框架,共建世界级跨区域合作的AI生态圈。“智源与港投的合作将加速人才、技术、资本的飞轮效应,构建人才循环体系,汇聚全球AI青年人才、支持AI创新创业、加速AI产业全球化。”
原文和模型
【原文链接】 阅读原文 [ 2322字 | 10分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★