标签:开源免费

32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%

浪潮信息推出的源2.0-M32模型,采用MoE架构,仅需5.28%的算力消耗,就能在精度上对标Llama 3。这一模型的总参数量为40B,激活参数量为3.7B,展现了卓越的性价...