“扩散模型”的搜索结果

斯坦福大学的研究者提出了一种名为“潜在透明度”的方法，使得大规模预训练的潜在扩散模型能够生成透明图像以及多个透明图层。这一进展与...

AIGC动态

7个月前

这篇研究综述由理海大学和微软研究院的华人团队发布，深入分析了Sora模型的技术细节、应用前景和局限性。Sora是一个基于扩散模型和Trans...

AIGC动态

7个月前

阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图生视频模型。这个模型能够根据用户提供的一张照片和音频文件生成具有丰富面部表情和...

AIGC动态

7个月前

摘要：本文回顾了Sora视频技术的发展背景、技术细节、应用前景以及局限性。Sora是OpenAI开发的一种能够根据文本指令生成长达一分钟视频...

AIGC动态

7个月前

LayerDiffusion 是ControlNet作者最新提出的一种方法，它允许大规模预训练的潜在扩散模型（如Stable Diffusion）生成透明图像。这项技术...

AIGC动态

7个月前

摘要：阿里巴巴集团智能计算研究院推出了一款名为EMO（Emote Portrait Alive）的AI图生视频模型。EMO能够根据用户提供的一张照片和音频...

AIGC动态

7个月前

本文介绍了阿里巴巴集团AI研究院推出的创新性视频模型——EMO。该模型能够通过用户提供的图像和音频生成表情丰富的视频，如让张国荣唱歌或...

AIGC动态

7个月前

摘要总结：Sora的创新：2024年，Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式，结合Transfo...

AIGC动态

7个月前

摘要：OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2，预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度...

AIGC动态

7个月前

阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图片-音频-视频模型技术，这是一种能够根据一张照片和音频文件生成会说话唱歌的AI视频...

AIGC动态

7个月前