AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入

AIGC动态1天前发布 QbitAI
34 0 0
AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入

 

文章摘要


【关 键 词】 AI生图图像编辑风格迁移文本编辑在线试玩

AI生图领域有新突破,新模型FLUX.1 Kontext可同时接受文本和图像输入,它采用流匹配架构,与此前技术不同,由Black Forest Labs推出,官方称能真正实现上下文生成和编辑。

该模型编辑和生成能力出色。在编辑上,有人给奥特曼尴尬照P上小绿龙;在生成能力方面,网友测试的猩猩打羽毛球细节丰富。它具有角色一致性(可跨场景保留元素)、局部编辑(只针对特定部分而不影响其余部分)、风格参考(以现有风格生成新场景)、交互速度快(以最小延迟进行迭代)四大特性。本次提供专业版FLUX.1 Kontext [pro]、最高配版FLUX.1 Kontext [max],还推出官方试玩平台Flux Playground,同时开放权重版FLUX.1 Kontext [dev]进行内测。

第三方平台Replicate对其测试显示,它比OpenAI的4o效果更好、价格更便宜,图像也不会偏黄。测试报告给出不同功能的提示词技巧:
图像编辑:编辑人物保留身份特征,风格迁移保留基本特征,复杂更改分步骤描述每次修改。
风格迁移:风格标签具体到流派或艺术家,不精准则描述关键特征,想保留元素需明确说明。
文本编辑:支持新增、删除、定位修改文本,使用易读字体,明确保留内容,匹配文本长度。
角色一致性:连续编辑先明确人物及变化和保留方面,描述越具体越好。
其他技巧总结:使用清晰详细语言、分解复杂编辑、明确保留部分、用描述性短语、编辑文本用引号、明确控制构图、谨慎选择动词。

此外,网友测试该模型还可删除文本。在文生图领域格局中,在AritificialAnalysis排行榜上,GPT – 4o、字节的Seedream 3.0和Recraft V3排名前三,Black Forest Labs的上一代爆款产品FLUX.1相对靠后,值得期待FLUX.1 Kontex的投票结果。该模型可通过链接https://playground.bfl.ai/image/generate在线试玩

原文和模型


【原文链接】 阅读原文 [ 1264字 | 6分钟 ]
【原文作者】 量子位
【摘要模型】 doubao-1.5-pro-32k
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...