“清华系Sora”全球上线,生成一段视频需30秒,每月支付58元|钛媒体AGI
文章摘要
【关 键 词】 AI视频、技术创新、高清视频、多模态、市场潜力
7月30日,北京生数科技有限公司联合清华大学发布了国内首个自研的AI生成视频大模型Vidu,并向全球用户开放使用。Vidu具备文生视频和图生视频两大核心功能,提供4秒和8秒两种视频时长选择,最高分辨率可达1080P。该模型采用了团队原创的Diffusion与Transformer融合架构U-ViT,支持一键生成长达16秒、1080P分辨率的高清视频。
Vidu在保持高动态性、高逼真度、高一致性等优势的同时,新增了角色一致性、动漫风格、文字与特效画面生成等特色能力。生数科技表示,Vidu实现了业界最快的实测推理速度,生成一段4秒片段仅需30秒。用户可以直接使用邮箱注册体验Vidu。
在价格方面,Vidu提供免费版和3种收费机制。免费版每月有80积分,可生成20个4秒视频;按月度订阅,标准版、高级版、尊享版价格分别为19.99美元、59.99美元、199.99美元,每月分别可额外获得240、800、2880积分,视频时长延长到8秒,可去水印和商用。目前上线前两周,Vidu提供限时5折优惠。按年订阅,标准版、高级版、尊享版价格分别为7.99美元/月、23.99美元/月、79.99美元/月。此外,Vidu还开放了API内测申请。
Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可大幅提升视频的可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。在画面质感上,Vidu在构图、叙事和光影等方面,能达到接近电影级效果。此外,Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG特效等。
生数科技联合创始人、CEO唐家渝表示,与美国OpenAI公司推出的视频生成”世界模拟器”Sora相比,目前国内AI视频生成领域还有一定差距,但有信心追赶并超越Sora。他认为,从底层架构来说,团队对Sora非常熟悉,一旦积累大量工程化经验,就有可能实现超越。目前,生数科技正重点突破长视频生成能力,尤其长视频画面的连贯性,正在进行一系列技术攻克。
此外,生数科技的投资方之一智谱AI也于7月26日公布了支持生成6秒时长的AI视频生成产品”清影”,目前已公开测试。在付费模式上,首发测试期间所有用户均可免费使用,付费5元可解锁一天的高速通道权益,付费199元可解锁一年的高速通道权益。
唐家渝还表示,智谱AI和百度与生数科技的定位关系并不冲突。百度主要聚焦于语言模型,对于多模态模型则与生数科技合作,包括3D、图像等层面。目前,国内视频生成长度在4-5秒左右,生数科技正努力突破长视频生成能力,以实现更连贯的长视频画面效果。
总的来说,Vidu的上线标志着国内AI视频生成技术迈出了重要一步,展现了生数科技在该领域的创新能力和技术实力。随着技术的不断进步和优化,未来国内AI视频生成领域有望实现更多突破,为用户带来更高质量的视频生成体验。
原文和模型
【原文链接】 阅读原文 [ 1232字 | 5分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆