VBench直接干到了第一！这一次，视频生成「压番」全场的是家央企

AIGC动态9个月前发布 almosthuman2014

2,162 0 0

文章摘要

中国电信人工智能研究院（TeleAI）发布了一款视频生成大模型，展示了中国电信在AI领域与科技巨头竞争的决心。该模型在VBench评测框架中表现优异，获得16个评分维度中的9项第一，尤其在画面稳定性、语义一致性、空间场景和视觉风格等核心能力上得分超过99%，物体分类和人体动作两项获得满分。模型的语义表达能力领先，视频质量出色，超越了Runway Gen-3、可灵、Vidu等竞争对手。

TeleAI的模型能够处理复杂的视频内容，如3分钟视频内4个主角的流畅切换和多场景变化，同时保持目标一致性。模型在主体一致性、多场景连续性和多镜头叙事方面表现出色，能够生成与画面完美契合的音频效果。此外，模型在遵循物理和常识方面展现出实力，在人体动作和物体分类两项指标上获得满分。

TeleAI的目标是利用其全模态技术布局，实现用户输入故事构思即可一键生成短剧的愿景。他们开发的二阶段视频生成技术VAST，通过先画分镜再生成视频的方式，提升了短剧创作过程的可控性。这一技术使得从剧本创作到视频生成的全流程变得更加便捷，为AI短剧时代的到来铺平了道路。