标签:MEGALODON

Meta无限长文本大模型来了:参数仅7B,已开源

Meta近日提出了一种名为MEGALODON的新型神经架构,用于高效地处理无限长的文本序列。这一技术的提出是为了解决传统Transformer模型在处理长序列时存在的二次...