刚刚，智源全新「悟界」系列大模型炸场！AI第一次真正「看见」宏观-微观双宇宙

AIGC动态3个月前发布 almosthuman2014

1,110 0 0

文章摘要

AI领域在2025年展现出跨越式发展态势，技术前沿已从单一模态理解扩展到对物理世界的系统性建模。第七届智源大会汇集全球顶尖学者与企业领袖，集中探讨了智能体、世界模型、多模态大模型等关键方向的最新进展。智源研究院发布的「悟界」系列大模型标志着技术范式的战略转型，其四大核心成果体现了AI向物理世界渗透的深度与广度。

原生多模态世界模型Emu3突破传统架构限制，构建了跨模态的统一表征空间。通过新型视觉tokenizer技术，该模型将文本、图像、视频等异构数据转化为同构符号序列，实现端到端的多模态理解与生成。这种底层融合架构显著提升了跨模态交互的自然度，为创意生成、智能搜索等场景奠定技术基础。其衍生模型「见微Brainμ」更开创性地整合了MRI、EEG等神经信号，在脑疾病诊断、感觉信号重建等任务中超越专用模型性能，成为神经科学领域首个通用基础平台，推动脑机接口技术向消费级应用迈进。

具身智能领域迎来重大突破，RoboOS 2.0与RoboBrain 2.0构成「Linux+GPT」式技术生态。该框架通过SaaS模式实现跨本体技能共享，将开发门槛降低至传统方法的10%，全链路响应时延压缩至3毫秒以内。配套的具身大脑模型在任务规划准确率上提升74%，新增的空间推理能力使机器人能处理复杂环境中的多步指令，标志着通用机器人基础架构的成熟。

在微观尺度上，OpenComplex2模型首次实现全原子级生命动态建模。该技术通过图扩散框架捕捉蛋白质构象分布，在CASP16竞赛中成为唯一能预测动态结构的团队。这种对生物分子「静动态」的双重解析能力，为药物研发提供了原子精度的研究工具。

当前AI发展呈现出从数字建模向物理赋能的明确转向，智源的布局反映了对行业趋势的前瞻把握。世界模型、脑科学、具身智能与微观生命建模的协同推进，不仅拓展了AI的技术疆界，更构建起连接虚拟与物理世界的技术矩阵。这些突破预示着大模型技术正从语言交互层面向实体系统深层渗透，为通用人工智能的实现开辟了新的技术路径。