VBench直接干到了第一!这一次,视频生成「压番」全场的是家央企

VBench直接干到了第一!这一次,视频生成「压番」全场的是家央企

 

文章摘要


【关 键 词】 AI视频视频生成语义一致全模态短剧创作

中国电信人工智能研究院(TeleAI)发布了一款视频生成大模型,展示了中国电信在AI领域与科技巨头竞争的决心。该模型在VBench评测框架中表现优异,获得16个评分维度中的9项第一,尤其在画面稳定性、语义一致性、空间场景和视觉风格等核心能力上得分超过99%,物体分类和人体动作两项获得满分。模型的语义表达能力领先,视频质量出色,超越了Runway Gen-3、可灵、Vidu等竞争对手。

TeleAI的模型能够处理复杂的视频内容,如3分钟视频内4个主角的流畅切换和多场景变化,同时保持目标一致性。模型在主体一致性、多场景连续性和多镜头叙事方面表现出色,能够生成与画面完美契合的音频效果。此外,模型在遵循物理和常识方面展现出实力,在人体动作和物体分类两项指标上获得满分。

TeleAI的目标是利用其全模态技术布局,实现用户输入故事构思即可一键生成短剧的愿景。他们开发的二阶段视频生成技术VAST,通过先画分镜再生成视频的方式,提升了短剧创作过程的可控性。这一技术使得从剧本创作到视频生成的全流程变得更加便捷,为AI短剧时代的到来铺平了道路。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3326字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...