刚刚,智源全新「悟界」系列大模型炸场!AI第一次真正「看见」宏观-微观双宇宙

刚刚,智源全新「悟界」系列大模型炸场!AI第一次真正「看见」宏观-微观双宇宙

 

文章摘要


【关 键 词】 AI技术世界模型具身智能多模态脑科学

AI领域在2025年展现出跨越式发展态势,技术前沿已从单一模态理解扩展到对物理世界的系统性建模。第七届智源大会汇集全球顶尖学者与企业领袖,集中探讨了智能体、世界模型多模态大模型等关键方向的最新进展。智源研究院发布的「悟界」系列大模型标志着技术范式的战略转型,其四大核心成果体现了AI向物理世界渗透的深度与广度。

原生多模态世界模型Emu3突破传统架构限制,构建了跨模态的统一表征空间。通过新型视觉tokenizer技术,该模型将文本、图像、视频等异构数据转化为同构符号序列,实现端到端的多模态理解与生成。这种底层融合架构显著提升了跨模态交互的自然度,为创意生成、智能搜索等场景奠定技术基础。其衍生模型「见微Brainμ」更开创性地整合了MRI、EEG等神经信号,在脑疾病诊断、感觉信号重建等任务中超越专用模型性能,成为神经科学领域首个通用基础平台,推动脑机接口技术向消费级应用迈进。

具身智能领域迎来重大突破,RoboOS 2.0与RoboBrain 2.0构成「Linux+GPT」式技术生态。该框架通过SaaS模式实现跨本体技能共享,将开发门槛降低至传统方法的10%,全链路响应时延压缩至3毫秒以内。配套的具身大脑模型在任务规划准确率上提升74%,新增的空间推理能力使机器人能处理复杂环境中的多步指令,标志着通用机器人基础架构的成熟

在微观尺度上,OpenComplex2模型首次实现全原子级生命动态建模。该技术通过图扩散框架捕捉蛋白质构象分布,在CASP16竞赛中成为唯一能预测动态结构的团队。这种对生物分子「静动态」的双重解析能力,为药物研发提供了原子精度的研究工具。

当前AI发展呈现出从数字建模向物理赋能的明确转向,智源的布局反映了对行业趋势的前瞻把握。世界模型、脑科学、具身智能与微观生命建模的协同推进,不仅拓展了AI的技术疆界,更构建起连接虚拟与物理世界的技术矩阵。这些突破预示着大模型技术正从语言交互层面向实体系统深层渗透,为通用人工智能的实现开辟了新的技术路径。

原文和模型


【原文链接】 阅读原文 [ 4526字 | 19分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...