4位图灵奖得主布道，2大冠军机器人登台，“AI春晚”果然又高又硬

689 0 0

文章摘要

智源大会2024以“AI春晚”规格拉开帷幕，人形机器人冠军天工与宇树G1同台展示技能迭代成果。宇树G1凭借灵活拳击动作展现运动控制突破，天工2.0版本则从长跑转向家政场景，演示甜点制作能力。现场还呈现了银河通用机器人通过语音指令完成物流任务的交互案例，凸显具身智能的实用化进展。

大会核心焦点是“悟界”系列大模型的全球首发，标志着智源研究院从语言模型向物理世界探索的战略转型。该系列包含四款突破性模型：原生多模态世界模型Emu3实现文本、图像、视频的任意组合理解与生成；脑科学模型Brainμ通过统一脑信号token化技术，在睡眠分型、脑疾病诊断等任务中超越专有模型；具身大脑RoboBrain 2.0任务规划准确率提升74%，新增空间推理与闭环反馈能力；微观生命模型OpenComplex2突破生物分子动态构象预测瓶颈，揭示原子级生命活动机制。技术路径显示，大模型正从数字认知向物理世界交互、从宏观场景向微观生命科学双向拓展。

开源生态建设取得显著进展，具身智能框架RoboOS 2.0实现代码量缩减至传统方法1/10，端到端响应延迟低于3ms。FlagOpen开源体系累计发布200个模型，总下载量达6.4亿次，推动产学研协同创新。多位图灵奖得主参与技术研讨，Bengio提出双重安全治理方案：开发非代理性AI系统与建立国际监管框架。强化学习之父Richard Sutton指出AI正进入“体验时代”，需通过动态交互生成知识。

产业落地层面，大模型CEO论坛汇聚面壁、智谱等企业领袖，显示技术商业化进程加速。Physical Intelligence创始人强调视觉语言动作（VLA）模型对机器人泛化能力的关键作用，与会专家认为人形机器人短期仍是重要载体，但长期形态将多样化。智源研究院通过基础模型开源与跨领域合作，在高校研究与企业应用间搭建桥梁，其原生多模态架构等高风险探索为行业提供技术基础设施。