
文章摘要
【关 键 词】 LongCat模型、算力调度、技术创新、性能测试、美团布局
美团最新发布的 LongCat – Flash 模型将外卖“派单逻辑”应用于 AI 世界,精准调度算力,试图在大模型赛道开辟新战场。
技术创新方面,LongCat – Flash 的特别之处在于“精打细算”。其总参数规模达 5600 亿,但实际推理时每个 token 仅调用约 18.6B – 31.3B。“零计算专家”可处理简单任务,遇到简单 token 直接放行,避免算力浪费,实现“按需分配”。ScMoE 创新点则让算力使用和通信同时进行,提升整体效率,在相同算力预算下,加入零计算专家的模型 loss 更低、收敛更快,ScMoE 在吞吐率和推理速度上显著提升。
工程能力方面,LongCat – Flash 采用逐步扩张的训练方式,先小范围试运行,再推广到更大范围。同时设置“三重保障”,即 Router 稳定、激活稳定、优化器稳定,确保系统稳定运行,在 30 天里完成了 20 万亿 tokens 的训练任务。
性能比较方面,LongCat – Flash 在各大基准测试中表现稳健。在通用任务、复杂推理、数学能力、编程任务等测试中,与国际一线模型水准相当,虽部分测试略低于 Kimi – K2,但优于多数基线模型。
实测方面,美团 LongCat – Flash 虽在性能上未遥遥领先,但速度极快。在处理同样的提示词时,相比 kimi 1.5 能更快输出内容,且核心代码质量相当。
尽管 LongCat – Flash 的速度和价格优势未必能立刻改写行业格局,毕竟大模型市场生态和用户习惯更具粘性,但它透露出美团用“调度运力”逻辑解决复杂科技问题、用价格杠杆撬开市场的信号。美团看似“接地气”的切入点,可能成为搅动格局的变量,其能否靠此在大模型领域取得成功,虽尚无定论,但它已递出了第一张筹码。
原文和模型
【原文链接】 阅读原文 [ 1650字 | 7分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★☆