标签:技术突破
智源悟界·Emu3.5发布,开启“下一个状态预测”!王仲远:或开启第三个 Scaling 范式
智源研究院于2024年10月发布的悟界·Emu3是全球首个基于'Next-Token Prediction'的原生多模态世界模型,实现了图像、文本、视频的统一处理。一年后升级的Emu3....
语言模型之后,智源 EMU3.5 找到了 AI 的「第三种 Scaling 范式」
智源研究院发布的「悟界 EMU3.5」多模态世界大模型,标志着人工智能从语言学习向多模态世界学习演进的新阶段。在当前大语言模型文本能力逐渐触顶的背景下,多...
让 AI 开口「像人」:最难的不是智能,是「嗓音」
2025年,AI陪伴类硬件成为最热门赛道之一,其背后是AI语音技术的迅速成熟。从AI销售电话到口语陪练App,再到虚拟伙伴和主播,这些应用都指向一个新兴领域——Vo...
Sora天才辍学生归来!OpenAI组建3人神秘小队,豪赌超级人工智能
Will Depue,这位00后的天才辍学生和Sora背后的核心贡献者之一,宣布重返OpenAI并组建了一个三人小组,目标是实现超级人工智能(ASI)。他与Troy Luhman和Eri...
从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录
AI视频技术从极客专属到全民可用的跨越,标志着生成式AI进入新阶段。2025年第四季度,OpenAI的Sora 2与阿里的Wan2.5-Preview两大模型引发全球热潮,前者通过'...
从对话框到数字人:魔珐星云如何让每个AI都拥有”身体”?
AI技术正从二维世界迈向三维空间,真正的下一站是让AI走出平面,拥有在三维空间中表达和交互的身体。魔珐科技旗下的星云平台成为这一领域的先行者,通过文本...
智源悟界 · Emu3.5 重塑世界模型格局:首提多模态 Scaling 范式,AI 理解世界再进化
北京智源人工智能研究院发布了大规模多模态世界模型“悟界·Emu3.5”,该模型在模拟复杂物理世界方面展现出惊人的逼真度,并揭示了“多模态Scaling范式”的存在。...
刚刚,智源悟界·Emu3.5登场,原生具备世界建模能力
北京智源人工智能研究院发布了其多模态系列模型的最新力作——悟界・Emu3.5,被定义为“多模态世界大模型”。这一模型通过在超过10万亿的多模态Token上进行端到端...
中国自动驾驶领域迎来最大一笔融资,无人物流车开启三国杀
无人物流车赛道近期呈现白热化竞争态势,头部企业新石器和九识智能在融资、技术、市场布局等方面展开激烈角逐。10月23日,新石器宣布完成超6亿美元D轮融资,...
AI芯片战争关键一役!英伟达最强Blackwell首次「美国造」
周五,英伟达与台积电在美国亚利桑那州工厂联合展示了首片Blackwell架构AI芯片晶圆,标志着全球最先进的AI芯片首次实现「美国本土制造」。这一事件被业界誉为...



