超6.4亿次下载！智源发布具身大脑等五大新技术，王仲远：具身智能的淘汰赛还没开始

852 0 0

文章摘要

第七届智源大会于6月6日在北京召开，北京智源人工智能研究院发布了“悟界”系列大模型，标志着AI技术从数字世界向物理世界的加速迈进。这一系列包括原生多模态世界模型Emu3、跨本体具身大小脑协作框架RoboOS 2.0与全新智源具身大脑RoboBrain 2.0、全球首个脑科学多模态通用基础模型见微Brainμ以及全原子微观生命模型OpenComplex2。“悟界”系列大模型承载的是智源对AI从数字世界迈向物理世界的技术趋势的判断。智源研究院院长王仲远指出，当前AI大模型技术还远未到发展尽头，多模态数据的有效利用是实现物理AGI的重要路径。

具身智能是本次大会的重要议题之一。王仲远强调，具身智能并不局限于人形机器人，而是可以适配多种机器人类别。“具身智能的‘小组赛’还没结束，远没有到‘淘汰赛’。”他认为，未来机器人将首先在特定场景中落地，尤其是在工厂等封闭环境中完成固定、重复或危险的任务，这将是具身智能的第一波红利。然而，当前人形机器人的硬件和模型均未成熟，技术路径尚未明确，数据采集困难，软硬件协同复杂，产业落地周期较长。“未来5-10年，大小脑融合的模型可能会成熟，但不是今天。”

智源研究院自2018年成立以来，致力于AI创新，累计孵化加速了10余家具有核心技术能力的AI创新企业，估值超过百亿的有1家，超过十亿的有5家。“实践证明，我们对于技术演进路径预判的正确性。”智源通过多种研发方式，利用原生多模态世界模型，让AI感知和理解物理世界，并进行交互。在宏观层面，大模型与硬件结合，通过具身智能的发展解决实际生产生活问题；在微观层面，基于生成式AI的蛋白质、脑机接口等应用，进一步揭示微观世界的本质。

多模态技术是AI发展的另一大方向。王仲远指出，多模态数据是文字数据的百倍、千倍乃至万倍，这些数据远未被有效利用。“多模态技术路线还没有收敛，文生图、文生视频走的是Transformer+Diffusion的技术路线，比较确定，能力不断提升，在某些特定场景已落地。”智源开源模型全球总下载量超6.4亿次，AI系统软件栈FlagOS对11家国内外厂商18款AI芯片已统一支持，开源超160个数据集，下载量近113万次，开源项目代码下载量超140万次。

此外，智源研究院与北京大学第一医院签署战略合作协议，并与香港投资管理有限公司建立战略合作框架，共建世界级跨区域合作的AI生态圈。“智源与港投的合作将加速人才、技术、资本的飞轮效应，构建人才循环体系，汇聚全球AI青年人才、支持AI创新创业、加速AI产业全球化。”