标签:注意力机制

图解Transformer工作原理

本文是关于 Transformer 的系列文章的第二篇,主要深入探讨了 Transformer 的内部工作机制。Transformer 的架构主要由编码器(Encoder)和解码器(Decoder)...

图解Transformer架构设计

近年来,Transformer技术在自然语言处理(NLP)领域引起了巨大关注。Transformer是一种新型架构,利用注意力机制显著提升深度学习NLP翻译模型性能。自从在论...

文本生成4K超高清图像,华为等推出创新模型PixArt-Σ

是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一款文本生成4K超高清图像的模型。与上一代PixArt-α相比,在图像质量、细节、训练效率以及...
1 2