视频生成产品 Vidu 全球上线,4s 视频仅需 30s 时间,业界最快
文章摘要
【关 键 词】 视频生成、AI技术、角色一致性、动漫风格、快速生成
7月30日,生数科技发布了国内首个自主研发的视频生成大模型Vidu,并向全球用户开放。Vidu以其卓越的视频生成效果迅速获得国内外广泛关注。该模型提供两大核心功能:文生视频和图生视频,能够生成4秒或8秒、最高1080P分辨率的视频,且4秒视频的生成时间仅需30秒。用户注册后即可直接使用,无需申请。
Vidu在最新版本中新增了动漫风格和角色一致性功能。在风格上,Vidu不仅支持写实等多元风格,还新增了动漫风格,使AI视频工具不再局限于现实风格的创作。在图生视频功能中,Vidu能够保持风格一致性,生成流畅的画面,解决了其他工具常见的画面崩坏和动作幅度小的问题。
Vidu的角色一致性功能允许用户上传人像图或自定义角色图,并通过文字描述指定角色的场景和动作,实现角色的一致性生成。例如,上传一张埃隆·马斯克的照片,通过输入描述词,可以将其变身为超级英雄钢铁侠。这一功能为用户创作梗图、表情包提供了更多可能性。
在语义理解方面,Vidu能够准确理解提示词中的字母、数字等,并生成相应的文字特效。此外,Vidu还能够理解和表达第一人称、延时摄影等镜头语言,提高了视频的可控性。在动态一致性方面,Vidu能够将运动主体与场景较好地分离,使画面主体动态完整,增强了画面的真实感。
Vidu在画面质感方面也表现出色,能够生成风格多样的片段,如科幻、西部、浪漫等类型电影。在构图、叙事、光影等方面,Vidu达到了接近电影级的画面标准。同时,Vidu还能够模仿和再现经典影片中的标志性视觉效果,如《银翼杀手》中的赛博朋克氛围。
在生成速度方面,Vidu将4秒视频的生成时间缩短至仅需30秒,比业内最快水平的Gen-3工具还要快一倍。这一速度的提升为用户带来了更丰富顺滑的创作体验。Vidu的上线为视频生成领域带来了新的选择,预示着未来视频模型竞争将愈发激烈。
除了Vidu,文章还提到了其他AI视频工具的相关信息,如Luma AI首席科学家的专访、Runway公司的视频生成技术、Scale AI的商业模式以及a16z创始人对AI创业的看法。这些内容为读者提供了更全面的行业视角。
总的来说,Vidu的上线标志着国内AI视频生成技术的一大突破,其创新的功能和出色的性能为用户带来了全新的创作体验。随着技术的不断发展,未来视频生成领域将呈现出更加多元化和高质量的作品。
原文和模型
【原文链接】 阅读原文 [ 3392字 | 14分钟 ]
【原文作者】 Founder Park
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★