3分钟用AI让照片开口说话，去造属于自己的梦吧。

1,944 0 0

文章摘要

文章介绍了一种利用AI技术实现的口型驱动技术，该技术能够使照片中的角色开口说话。作者通过使用“即梦”这个工具，展示了如何将一张照片和一段语音结合起来，创造出动态的视频效果。用户只需准备一张照片和一段语音，即可通过即梦平台的视频生成功能，实现对口型的效果。文章中提到，即使不使用AI声音克隆，用户也可以选择即梦提供的文本朗读功能，拥有多种音色选择。

作者通过实际操作，展示了如何将亚洲帅哥的照片与模仿《大话西游》经典台词的语音结合，生成了一个19秒的视频。在生成效果上，作者强调选择“生动”模式，以使角色的嘴、眼睛和头部都能自然运动，提高视频的真实感。文章也指出了即梦平台的一个缺陷，即上传的角色比例会被自动裁剪成1:1，无法调整，但作者期待12月的更新能解决这一问题。

文章还提到，AI技术的应用不仅限于真人照片，2D和3D动漫人物也可以通过语音驱动让照片说话，甚至可以实现唱歌的效果。作者通过自己的经验，表达了对AI技术在创作中应用的热爱，认为AI技术如同魔法，能够将不可能的人和时空交织在一起，创造出独特的作品形式。

最后，作者鼓励读者尝试使用AI技术，去创造属于自己的作品，体验技术带来的浪漫和创造力。文章以作者的感慨结束，强调AI技术不仅仅是让照片开口说话，更是放大了人们内心的声音。