超越恐怖谷！全球500万网友被骗，爆火TEDx演讲者没一个是真人？

AIGC动态1年前 (2024)发布 AIera

2,443 0 0

文章摘要

最近，一系列看似真实的TED演讲者图片在社交媒体上引起了广泛关注，这些图片实际上是由人工智能生成的。这些图片的逼真程度让网友们惊叹不已，甚至AI识别软件也无法识别出它们是AI生成的。这些图片的制作者Leo Kadieff是Stable Diffusion团队的前成员，他使用了最新的Flux真实版LoRA技术制作了这些图片。LoRA技术改进了模型，使得图片的真实感大大增加。此外，这个工作流还简化了复杂的提示词，使得生成现实主义图片变得更加简单。

与此同时，另一位分享者Kyrannio尝试使用Midjourney复刻了这些图片，但生成效果与Leo Kadieff的作品相比仍有较大差距。此外，谷歌Imagen 3的公开可用也引发了网友们的尝试热潮。Imagen 3能够轻松应对复杂的提示词，显示出其强大的能力。

除了图片生成，AI视频生成也引起了关注。Runway创意总监Nicolas Neubert使用Gen-3 Alpha生成了一段视频，虽然效果不错，但仍存在一些细微的bug，如人物的舌头、牙齿、阴影等细节处理不够自然。这表明AI在生成视频方面仍有很大的提升空间。

此外，Stable Diffusion一作、Stability AI核心成员Robin Rombach成立的Black Forest Labs推出了FLUX.1系列模型，其效果在图像细节、提示词遵循、风格多样性和场景复杂性方面都取得了显著的成果。FLUX.1系列模型基于多模态和并行扩散Transformer块的混合架构，参数规模为120亿，通过构建流匹配和旋转位置嵌入等技术提高了模型性能和硬件效率。

总的来说，AI生成图片和视频的技术正在快速发展，逼真程度不断提高，但仍然存在一些细节问题需要解决。随着技术的不断进步，未来AI在图像和视频生成方面的表现将更加出色。