文章摘要
【关 键 词】 AI技术、图片生成、逼真效果、视频生成、技术发展
最近,一系列看似真实的TED演讲者图片在社交媒体上引起了广泛关注,这些图片实际上是由人工智能生成的。这些图片的逼真程度让网友们惊叹不已,甚至AI识别软件也无法识别出它们是AI生成的。这些图片的制作者Leo Kadieff是Stable Diffusion团队的前成员,他使用了最新的Flux真实版LoRA技术制作了这些图片。LoRA技术改进了模型,使得图片的真实感大大增加。此外,这个工作流还简化了复杂的提示词,使得生成现实主义图片变得更加简单。
与此同时,另一位分享者Kyrannio尝试使用Midjourney复刻了这些图片,但生成效果与Leo Kadieff的作品相比仍有较大差距。此外,谷歌Imagen 3的公开可用也引发了网友们的尝试热潮。Imagen 3能够轻松应对复杂的提示词,显示出其强大的能力。
除了图片生成,AI视频生成也引起了关注。Runway创意总监Nicolas Neubert使用Gen-3 Alpha生成了一段视频,虽然效果不错,但仍存在一些细微的bug,如人物的舌头、牙齿、阴影等细节处理不够自然。这表明AI在生成视频方面仍有很大的提升空间。
此外,Stable Diffusion一作、Stability AI核心成员Robin Rombach成立的Black Forest Labs推出了FLUX.1系列模型,其效果在图像细节、提示词遵循、风格多样性和场景复杂性方面都取得了显著的成果。FLUX.1系列模型基于多模态和并行扩散Transformer块的混合架构,参数规模为120亿,通过构建流匹配和旋转位置嵌入等技术提高了模型性能和硬件效率。
总的来说,AI生成图片和视频的技术正在快速发展,逼真程度不断提高,但仍然存在一些细节问题需要解决。随着技术的不断进步,未来AI在图像和视频生成方面的表现将更加出色。
原文和模型
【原文链接】 阅读原文 [ 2010字 | 9分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★