文章摘要
【关 键 词】 马斯克、阿里技术、通义App、全民演唱、EMO项目
文章介绍了阿里通义实验室开发的一项名为EMO的AI视频技术,该技术允许用户上传一张人物正面大头照,然后通过AI生成该人物唱歌或表演的视频。这项技术在社交媒体上引起了广泛关注,尤其是在马斯克访问北京期间,他也被这项技术所吸引。
EMO项目的热度很高,尽管有时需要排队几个小时,但用户对此表现出极大的兴趣。最受欢迎的是将路人马的脸合成到《野狼Disco》的视频片段中。除了唱歌,用户还可以将朋友的脸合成到各种表情包中。
技术背后的负责人薄列峰解释说,EMO的核心思路是“弱控制设计”,这意味着无需对整个面部进行建模,而是通过面部定位器和速度编码器来控制视频中的面部运动和表情。这种方法允许自然变化和表现力,同时保持角色身份的一致性。
EMO项目的开发团队专注于数字人技术,他们之前推出的Animate Anyone模型也非常成功。这个模型可以控制特定对象的动作,而且团队还对动物主体检测进行了优化,使得上传动物照片的通过率大幅提升。
薄列峰强调,未来的AIGC内容需要高于平均水平才会吸引用户消费。他还透露,EMO目前只能生成人头视频,但未来可能会扩展到半身甚至全身,实现更多的创意内容。他还建议用户可以尝试使用自己不同年龄阶段的照片来生成视频,以此来体验这项技术的乐趣。
总的来说,EMO项目展示了AI技术在视频内容生成方面的潜力,它降低了创作门槛,让普通用户也能轻松创作有趣的视频内容。同时,这项技术的开放性和易用性预示着未来数字娱乐领域的广阔发展前景。
原文和模型
【原文链接】 阅读原文 [ 2639字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 gpt-4
【摘要评分】 ★★★★★
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...