视频生成

成为具身智能“大脑”，多模态世界模型需要具备哪些能力？丨ToB产业观察

北京智源研究院最新发布的悟界·Emu3.5多模态世界大模型标志着人工智能技术的重大突破。这款参数量达34B的模型通过自研DiDA技术将推理速度提升20倍，并以'Next...

AIGC动态

1个月前

团队首次公开AI短片创作全过程，并宣布开源其制作方法。这一决定源于对创作流程复杂性的认知，以及小公司快速决策的优势。团队使用的核心工具是TapNow，一个...

AIGC动态

1个月前

一段小女孩与AI玩具告别的视频引发了广泛关注，揭示了对话式AI如何深度融入人类情感世界。这一场景不仅触动了公众情感，更凸显了实时交互技术的革命性潜力。...

AIGC动态

1个月前

银河通用联合多所高校团队推出全球首个跨本体全域环视导航基座大模型NavFoM，标志着机器人自主导航能力取得突破性进展。该模型通过统一“视频流+文本指令→动作...

AIGC动态

1个月前

RoboBrain-Memory是全球范围内首个专为全双工、全模态模型设计的终身记忆系统，由智源研究院、Spin Matrix、乐聚机器人与新加坡南洋理工大学等机构联合开发。...

AIGC动态

1个月前

美团LongCat团队发布了5600亿参数的开源全模态模型LongCat-Flash-Omni，该模型能够实现毫秒级的实时音频-视觉交互。其核心是一个端到端的全模态架构，能够接...

AIGC动态

1个月前

风投领域正经历前所未有的资本涌入人工智能初创企业，截至2025年10月已有近2000亿美元投入该领域。这一现象标志着AI产业进入全新发展阶段，全球范围内涌现出...

AIGC动态

1个月前

OpenAI旗下ChatGPT以7.69亿月活跃用户（MAU）持续领跑全球AI应用市场，结合网站用户总量突破10亿大关。这一数据在2025年10月的AI产品应用榜中展现出压倒性优...

AIGC动态

1个月前

昆仑万维旗下AI视频创作平台SkyReels于近期全面焕新上线，同步推出Web端与移动端APP，标志着其技术布局进入新阶段。该平台诞生于2023年，核心目标是解决长视...

AI-Agent

1个月前

生成式AI技术虽快速发展，但视频创作仍面临高门槛问题。当前流程涉及脚本撰写、画面生成、配音剪辑等多个环节，依赖不同软件工具，导致普通创作者需承担较高...

AI-Agent

1个月前