“U-Net”的搜索结果

我是跪着看完的:最接近SORA的开源模型来了!训练你自己的SORA模型!
文章介绍了一个名为Latte的开源模型,该模型采用了与SORA相同的Vision Transformer结构。文章首先讨论了Vision Transformer的优势,指出...
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收
摘要:OpenAI Sora的发布标志着视频生成领域的重大突破。Sora基于Diffusion Transformer架构,与主流的2D Stable Diffusion方法不同。这...
谷歌AI新星转投Pika:视频生成Lumiere一作,担任创始科学家
谷歌研究员Omer Bar-Tal加入Pika团队,担任创始科学家。他在一个月前与谷歌团队合作发布了视频生成模型Lumiere,该模型在视频生成领域取...
Boximator:字节跳动提出可控视频合成技术
字节跳动推出了一项名为Boximator的新技术,这是一种可控制视频中主体运动轨迹的技术。Boximator结合了框体和动画的概念,支持通过框选...
【AI 视频工具】为低质量的视频苦恼?高清化视频工具来了,Upscale-A-Video
文章主要介绍了Upscale-A-Video,一种用于视频超分辨率任务的文本引导的潜在扩散框架。该框架通过两个关键机制确保时间一致性:在本地,...
AI绘画中CLIP文本-图像预训练模型
感谢您提供的文章总结。下面是对文章中所有重要的词语或语句进行加粗处理:介绍OpenAI 在 2021 年提出了 CLIP(Contrastive Language–Im...
1 2