标签:硬件协同

MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍

华为团队推出的Pangu Pro MoE 72B模型在昇腾平台上实现了显著的推理性能提升,通过系统级软硬协同优化,推理性能提升6~8倍。该模型采用混合专家(MoE)架构,...