“源2.0-M32”的搜索结果

32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%
浪潮信息推出的源2.0-M32模型,采用MoE架构,仅需5.28%的算力消耗,就能在精度上对标Llama 3。这一模型的总参数量为40B,激活参数量为3....
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
在当前大模型算力需求极高的背景下,浪潮信息推出了一款名为源2.0-M32的混合专家模型。该模型以32个专家的架构,总参数量达到400亿,但...