标签:高分辨率

谷歌发布Imagen 3,超过SD3、DALL・E-3

谷歌DeepMind发布的Imagen 3模型在文本到图像生成领域取得了显著进步,相较于前代产品及同类产品展现出了卓越的性能。Imagen 3采用了潜空间扩散模型技术,这...

Midjourney大更新,细节最强文本生图片模型来啦!

Midjourney V6.1版本的发布标志着图片生成技术的重大进步,成为行业的新标杆。本次更新特别关注了细节的改进,包括眼睛、睫毛、瞳孔、腿、手臂、手指关节以及...

轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便

这篇文章介绍了上海AI Lab和香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(IXC2-4KHD)模型,这是一个可以自动分析PDF、网页、海报、Excel图表内容...

无需训练,这个新方法实现了生成图像尺寸、分辨率自由

近日,香港中文大学与商汤科技联合实验室的研究者们提出了一种名为FouriScale的方法,旨在改善预训练扩散模型在生成高分辨率图像时的性能。扩散模型因其卓越...

3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

。这项技术结合了计算方法的高保真度和人类视觉系统的灵活性,能够根据任意数量的无位姿图片生成密集、高分辨率的有位姿图像,实现高质量的3D模型重建。与人...

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

SnapChat背后的公司Snap联合特伦托大学等机构发布了一款名为Snap Video的文本生成视频模型。该模型采用了可扩展的时空Transformer架构,旨在提高视频生成的质...