真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验
文章摘要
【关 键 词】 图像编辑、自然语言、AI技术、通用模型、编辑精准
字节跳动豆包大模型团队推出了国内首个产品化的通用图像编辑模型SeedEdit,该模型通过简单的自然语言指令即可实现图像编辑,无需复杂的描边涂抹。SeedEdit能够理解中英文提示词、成语和专有名词,精准执行如更换背景、转换风格或指定区域元素的增删和替换等操作。在处理精细区域如玻璃裂纹、发丝时,SeedEdit能够保持原图完整性。此外,SeedEdit支持多轮操作,允许用户对同一图像进行连续创意编辑。
技术报告指出,SeedEdit采用Diffusion架构,在不引入新参数的情况下,将图像生成模型转换成图像编辑模型。其关键在于保持原始图像和生成新内容之间的平衡,实现图像编辑的通用性、可控性和高质量。SeedEdit已在豆包PC端和字节AIGC平台即梦网页端开始测试,展现了出色的图片编辑效果,引发了关于生成式AI修图技术是否能做到“毫无PS痕迹”的讨论。
SeedEdit的通用性和编辑精准度相较于其他AI绘图平台如Dall・E 3、Midjourney有显著提升。它不仅能够实现任意指令的编辑,还支持用户脑洞大开的奇思妙想。实测中,SeedEdit展现了对世界名画的精准编辑能力,如让蒙娜丽莎抱猫、换表情,或将《倒牛奶的女仆》背景换成麦当劳后厨等。SeedEdit还能进行元素替换和风格切换,如将金毛换成泰迪,或将画面风格换成涂鸦、乐高、3D等。
字节跳动在生成式AI技术领域的优势明显,豆包大模型团队在AI基础研究层面的工作不断获得认可,如单目深度估计模型Depth Anything V2入选苹果CoreML模型库。SeedEdit团队表示,将继续提升模型在复杂内容和精细控制层面的表现,并开放多轮复杂编辑功能,以期带来更多惊喜。
原文和模型
【原文链接】 阅读原文 [ 3991字 | 16分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆