“清华系Sora”全球上线，生成一段视频需30秒，每月支付58元｜钛媒体AGI

AIGC动态1年前 (2024)发布 TMTPOSTAGI

2,829 0 0

文章摘要

7月30日，北京生数科技有限公司联合清华大学发布了国内首个自研的AI生成视频大模型Vidu，并向全球用户开放使用。Vidu具备文生视频和图生视频两大核心功能，提供4秒和8秒两种视频时长选择，最高分辨率可达1080P。该模型采用了团队原创的Diffusion与Transformer融合架构U-ViT，支持一键生成长达16秒、1080P分辨率的高清视频。

Vidu在保持高动态性、高逼真度、高一致性等优势的同时，新增了角色一致性、动漫风格、文字与特效画面生成等特色能力。生数科技表示，Vidu实现了业界最快的实测推理速度，生成一段4秒片段仅需30秒。用户可以直接使用邮箱注册体验Vidu。

在价格方面，Vidu提供免费版和3种收费机制。免费版每月有80积分，可生成20个4秒视频；按月度订阅，标准版、高级版、尊享版价格分别为19.99美元、59.99美元、199.99美元，每月分别可额外获得240、800、2880积分，视频时长延长到8秒，可去水印和商用。目前上线前两周，Vidu提供限时5折优惠。按年订阅，标准版、高级版、尊享版价格分别为7.99美元/月、23.99美元/月、79.99美元/月。此外，Vidu还开放了API内测申请。

Vidu能够准确理解并生成提示词中的文字，包括字母、数字等，并能生成文字特效。对于第一人称、延时摄影等镜头语言，Vidu也能精准表达，用户只需细化提示词，即可大幅提升视频的可控性。同时，Vidu支持大幅度、精准的动作生成，保持高流畅、高动态的画面效果。在画面质感上，Vidu在构图、叙事和光影等方面，能达到接近电影级效果。此外，Vidu还能生成影视级特效画面，如烟雾、炫光效果、CG特效等。

生数科技联合创始人、CEO唐家渝表示，与美国OpenAI公司推出的视频生成”世界模拟器”Sora相比，目前国内AI视频生成领域还有一定差距，但有信心追赶并超越Sora。他认为，从底层架构来说，团队对Sora非常熟悉，一旦积累大量工程化经验，就有可能实现超越。目前，生数科技正重点突破长视频生成能力，尤其长视频画面的连贯性，正在进行一系列技术攻克。

此外，生数科技的投资方之一智谱AI也于7月26日公布了支持生成6秒时长的AI视频生成产品”清影”，目前已公开测试。在付费模式上，首发测试期间所有用户均可免费使用，付费5元可解锁一天的高速通道权益，付费199元可解锁一年的高速通道权益。

唐家渝还表示，智谱AI和百度与生数科技的定位关系并不冲突。百度主要聚焦于语言模型，对于多模态模型则与生数科技合作，包括3D、图像等层面。目前，国内视频生成长度在4-5秒左右，生数科技正努力突破长视频生成能力，以实现更连贯的长视频画面效果。

总的来说，Vidu的上线标志着国内AI视频生成技术迈出了重要一步，展现了生数科技在该领域的创新能力和技术实力。随着技术的不断进步和优化，未来国内AI视频生成领域有望实现更多突破，为用户带来更高质量的视频生成体验。