标签:Qwen3-Next

阿里DeepSeek时刻!开源新架构模型:推理快10倍、成本暴降90%

今天凌晨2点,阿里巴巴开源新架构模型Qwen3-Next-80B-A3B,引发广泛关注。Qwen3-Next是混合专家模型,总参数800亿,仅激活30亿,训练成本较Qwen3 - 32B暴降90...