“U-Net”的搜索结果

文章介绍了一个名为Latte的开源模型，该模型采用了与SORA相同的Vision Transformer结构。文章首先讨论了Vision Transformer的优势，指出...

AIGC动态

8个月前

摘要：OpenAI Sora的发布标志着视频生成领域的重大突破。Sora基于Diffusion Transformer架构，与主流的2D Stable Diffusion方法不同。这...

AIGC动态

8个月前

谷歌研究员Omer Bar-Tal加入Pika团队，担任创始科学家。他在一个月前与谷歌团队合作发布了视频生成模型Lumiere，该模型在视频生成领域取...

AIGC动态

8个月前

字节跳动推出了一项名为Boximator的新技术，这是一种可控制视频中主体运动轨迹的技术。Boximator结合了框体和动画的概念，支持通过框选...

AIGC动态

9个月前

文章主要介绍了Upscale-A-Video，一种用于视频超分辨率任务的文本引导的潜在扩散框架。该框架通过两个关键机制确保时间一致性：在本地，...

AIGC动态

9个月前

感谢您提供的文章总结。下面是对文章中所有重要的词语或语句进行加粗处理：介绍OpenAI 在 2021 年提出了 CLIP（Contrastive Language–Im...

AIGC动态

9个月前