标签:超球面

英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快

英伟达团队提出了一种新的神经网络架构——归一化Transformer(nGPT),这一架构在超球面上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,同时保...