“扩散模型”的搜索结果

ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计
斯坦福大学的研究者提出了一种名为“潜在透明度”的方法,使得大规模预训练的潜在扩散模型能够生成透明图像以及多个透明图层。这一进展与...
解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品
这篇研究综述由理海大学和微软研究院的华人团队发布,深入分析了Sora模型的技术细节、应用前景和局限性。Sora是一个基于扩散模型和Trans...
阿里最新图生视频模型效果好得可比肩 Sora,但 0 代码“假”开源让国内外网友骂翻了天?
阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图生视频模型。这个模型能够根据用户提供的一张照片和音频文件生成具有丰富面部表情和...
微软37页论文逆向工程Sora,得到了哪些结论?
摘要:本文回顾了Sora视频技术的发展背景、技术细节、应用前景以及局限性。Sora是OpenAI开发的一种能够根据文本指令生成长达一分钟视频...
ControlNet作者新作:AI绘画能分图层了!项目未开源就斩获660 Star
LayerDiffusion 是ControlNet作者最新提出的一种方法,它允许大规模预训练的潜在扩散模型(如Stable Diffusion)生成透明图像。这项技术...
阿里最新图生视频模型效果好得可比肩Sora,但0代码“假”开源让国内外网友骂翻了天?
摘要:阿里巴巴集团智能计算研究院推出了一款名为EMO(Emote Portrait Alive)的AI图生视频模型。EMO能够根据用户提供的一张照片和音频...
轻松让张国荣、赫本唱歌,阿里推出创新视频模型EMO
本文介绍了阿里巴巴集团AI研究院推出的创新性视频模型——EMO。该模型能够通过用户提供的图像和音频生成表情丰富的视频,如让张国荣唱歌或...
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transfo...
中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻
摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度...
太炸裂了!阿里开发出 AI 图生视频模型EMO,“高启强”普法、蒙拉丽莎唱歌,B站鬼畜即将被AI取代|钛媒体AGI
阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图片-音频-视频模型技术,这是一种能够根据一张照片和音频文件生成会说话唱歌的AI视频...
1 11 12 13 14 15 16