AI生图迎来大升级:图像编辑达到像素级!背后团队大多来自Stable Diffusion模型基础技术发明团队

AIGC动态1天前发布 ai-front
86 0 0
AI生图迎来大升级:图像编辑达到像素级!背后团队大多来自Stable Diffusion模型基础技术发明团队

 

文章摘要


【关 键 词】 图像模型流匹配跨轮编辑FLUX.1图像生成

德国初创公司 Black Forest Labs(BFL)发布了名为 FLUX.1 Kontext 的全新图像生成模型,可实现图像生成和编辑,并允许添加文本及其他图像进行内容修改。

模型特点与优势


联合创始人兼 CEO Robin Rombach 表示,该模型通过将图像生成和编辑统一在流匹配架构中,实现了跨多轮编辑的顶尖字符一致性,在 1MP 分辨率下保持 3 – 5 秒的交互式推理速度,达成真正的迭代式创意工作流程。其特殊之处包括角色一致性与跨场景元素保留能力、可局部编辑、能生成相同风格场景以及极低的输出延迟。

版本及应用


BFL 发布了 FLUX.1 Kontext [pro] 和 FLUX.1 Kontext [max] 两个版本,[dev] 版本即将开放内测。Pro 版适合企业快速迭代编辑,运行速度较以往先进模型快一个数量级,是首批允许多轮编辑的模型之一;Max 版速度快且性能强,能严格遵循提示词、输出内容易读,编辑过程保持一致性。Pro 版和 Max 版已在多个平台上线,帮助企业创意团队及开发者获得更精准、快速的图像编辑能力。

BFL 公司背景


这家公司由 Robin Rombach 等创立。Rombach 是参与构建 Stable Diffusion 的关键工程师之一,此前曾在 Stability AI 任职,后因该公司陷入困境于 2024 年 3 月离开,并在去年 8 月成立黑森林实验室,说服多位前同事加入。公司目前有 30 名员工,正在招聘技术职位且完全远程办公。公司已获得硅谷知名风投公司投资,专利 AI 模型位居下载排行榜榜首。

与其他模型对比及外界评价


众多图像与视频生成模型依赖 Diffussion 模型,而 FLUX.1 Kontext 是流模型,思路不同。在文生图基准测试中,它在美观度等方面可与其他顶尖模型媲美。已有部分用户试用 Kontext 模型并给出不俗评价,称赞其生成和编辑速度快、效果好,但该模型仍需面对与现有先进图像模型的竞争。

原文和模型


【原文链接】 阅读原文 [ 2470字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 doubao-1.5-pro-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...