标签:文本到图像

文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类

Playground Research最近推出了一款名为PGv3的文本到图像模型,该模型在多个方面实现了技术突破。PGv3拥有240亿参数量,采用了深度融合的大型语言模型,使其...

谷歌发布Imagen 3,超过SD3、DALL・E-3

谷歌DeepMind发布的Imagen 3模型在文本到图像生成领域取得了显著进步,相较于前代产品及同类产品展现出了卓越的性能。Imagen 3采用了潜空间扩散模型技术,这...

1890美元,就能从头训练一个还不错的12亿参数扩散模型

Sony AI等机构的研究者开发了一种低成本的端到端pipeline,用于训练文本到图像的扩散模型,显著降低了训练成本,同时不需要访问数十亿张训练图像或专有数据集...

可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」

。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员开始探索在T2I模型中引...