标签:面部潜在空间

微软推出VASA-1:可生成会说话的,动态人物视频

本文介绍了微软亚洲研究院推出的VASA-1,这是一个能够通过输入一张图片和一段音频生成表情丰富、细节逼真的动态人物视频的模型。根据演示效果,VASA-1能够以4...