达摩院发布一站式AI视频创作平台”寻光”，打造全新AI工作流

AIGC动态1年前 (2024)发布 almosthuman2014

2,532 0 0

文章摘要

今年，AI视频生成技术迎来了爆发式增长，以Sora为代表的算法模型和产品应用不断涌现，短时间内出现了几十种视频生成工具。AI视频创作方式逐渐流行，但也带来了新的挑战和质疑。

在上海世界人工智能大会（WAIC）上，达摩院发布了一站式AI视频创作平台“寻光”，定位为PUGC一站式AI视频创作平台，旨在提升创作全流程的效率。寻光平台支持剧本创作、分镜图等工作流整合，并提供丰富的AI编辑功能，如人物控制、场景控制、风格迁移、运镜控制、目标新增/消除/修改等，让视频中的元素和对象更加精准可控。

寻光平台在研发初期，与影视传媒从业者及创作者进行了广泛调研，发现视频图层是创作者们最迫切的需求。基于此，寻光平台推出了系统性的视频图层编辑功能，用户通过文本输入即可生成具有透明背景的视频，并一键融合到其他背景视频中。

达摩院认为，AI不会取代创作者的工作，而是优化视频创作的工作流，成为创意驱动的新引擎。寻光平台在设计时充分考虑了AI视频创作的特点，将每个视频项目抽象为多个分镜头画面，用户可根据剧本自动生成分镜头，也可以上传原始视频素材，由算法切分成多个分镜头。

寻光平台提供完整且智能的AI视频编辑能力，依据用户意图在语义层面实现编辑。分镜头里的人体、人脸、前景、背景等任意局部目标都可以进行精细化编辑和修改。

达摩院希望寻光视频创作平台成为每位创作者的专属视频工作室，实现AI与创作者之间更紧密、高效的协作，释放AI的生产力。达摩院视觉技术实验室致力于多模态视觉信号的理解与生成技术研究，当前重点研究方向包括更加精准的图像/视频/3D内容生成、更加可控的图像/视频/3D内容编辑、高效的生成框架和多模态理解-生成框架等。寻光将于近期开放内测，持续迭代优化交互，欢迎创作者们定制属于自己的AI工作流。