文章摘要
【关 键 词】 AI技术、口型驱动、视频生成、动态效果、创作体验
文章介绍了一种利用AI技术实现的口型驱动技术,该技术能够使照片中的角色开口说话。作者通过使用“即梦”这个工具,展示了如何将一张照片和一段语音结合起来,创造出动态的视频效果。用户只需准备一张照片和一段语音,即可通过即梦平台的视频生成功能,实现对口型的效果。文章中提到,即使不使用AI声音克隆,用户也可以选择即梦提供的文本朗读功能,拥有多种音色选择。
作者通过实际操作,展示了如何将亚洲帅哥的照片与模仿《大话西游》经典台词的语音结合,生成了一个19秒的视频。在生成效果上,作者强调选择“生动”模式,以使角色的嘴、眼睛和头部都能自然运动,提高视频的真实感。文章也指出了即梦平台的一个缺陷,即上传的角色比例会被自动裁剪成1:1,无法调整,但作者期待12月的更新能解决这一问题。
文章还提到,AI技术的应用不仅限于真人照片,2D和3D动漫人物也可以通过语音驱动让照片说话,甚至可以实现唱歌的效果。作者通过自己的经验,表达了对AI技术在创作中应用的热爱,认为AI技术如同魔法,能够将不可能的人和时空交织在一起,创造出独特的作品形式。
最后,作者鼓励读者尝试使用AI技术,去创造属于自己的作品,体验技术带来的浪漫和创造力。文章以作者的感慨结束,强调AI技术不仅仅是让照片开口说话,更是放大了人们内心的声音。
原文和模型
【原文链接】 阅读原文 [ 1661字 | 7分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...