标签:Vision Transformer

我是跪着看完的:最接近SORA的开源模型来了!训练你自己的SORA模型!

文章介绍了一个名为Latte的开源模型,该模型采用了与SORA相同的Vision Transformer结构。文章首先讨论了Vision Transformer的优势,指出其能够更好地处理视频...