
文章摘要
【关 键 词】 图像模型、流匹配、跨轮编辑、FLUX.1、图像生成
德国初创公司 Black Forest Labs(BFL)发布了名为 FLUX.1 Kontext 的全新图像生成模型,可实现图像生成和编辑,并允许添加文本及其他图像进行内容修改。
模型特点与优势
联合创始人兼 CEO Robin Rombach 表示,该模型通过将图像生成和编辑统一在流匹配架构中,实现了跨多轮编辑的顶尖字符一致性,在 1MP 分辨率下保持 3 – 5 秒的交互式推理速度,达成真正的迭代式创意工作流程。其特殊之处包括角色一致性与跨场景元素保留能力、可局部编辑、能生成相同风格场景以及极低的输出延迟。
版本及应用
BFL 发布了 FLUX.1 Kontext [pro] 和 FLUX.1 Kontext [max] 两个版本,[dev] 版本即将开放内测。Pro 版适合企业快速迭代编辑,运行速度较以往先进模型快一个数量级,是首批允许多轮编辑的模型之一;Max 版速度快且性能强,能严格遵循提示词、输出内容易读,编辑过程保持一致性。Pro 版和 Max 版已在多个平台上线,帮助企业创意团队及开发者获得更精准、快速的图像编辑能力。
BFL 公司背景
这家公司由 Robin Rombach 等创立。Rombach 是参与构建 Stable Diffusion 的关键工程师之一,此前曾在 Stability AI 任职,后因该公司陷入困境于 2024 年 3 月离开,并在去年 8 月成立黑森林实验室,说服多位前同事加入。公司目前有 30 名员工,正在招聘技术职位且完全远程办公。公司已获得硅谷知名风投公司投资,专利 AI 模型位居下载排行榜榜首。
与其他模型对比及外界评价
众多图像与视频生成模型依赖 Diffussion 模型,而 FLUX.1 Kontext 是流模型,思路不同。在文生图基准测试中,它在美观度等方面可与其他顶尖模型媲美。已有部分用户试用 Kontext 模型并给出不俗评价,称赞其生成和编辑速度快、效果好,但该模型仍需面对与现有先进图像模型的竞争。
原文和模型
【原文链接】 阅读原文 [ 2470字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 doubao-1.5-pro-32k
【摘要评分】 ★★★★★