美团新模型有点东西：像调度外卖运力一样优化大模型

60 0 0

文章摘要

美团最新发布的 LongCat – Flash 模型将外卖“派单逻辑”应用于 AI 世界，精准调度算力，试图在大模型赛道开辟新战场。

技术创新方面，LongCat – Flash 的特别之处在于“精打细算”。其总参数规模达 5600 亿，但实际推理时每个 token 仅调用约 18.6B – 31.3B。“零计算专家”可处理简单任务，遇到简单 token 直接放行，避免算力浪费，实现“按需分配”。ScMoE 创新点则让算力使用和通信同时进行，提升整体效率，在相同算力预算下，加入零计算专家的模型 loss 更低、收敛更快，ScMoE 在吞吐率和推理速度上显著提升。

工程能力方面，LongCat – Flash 采用逐步扩张的训练方式，先小范围试运行，再推广到更大范围。同时设置“三重保障”，即 Router 稳定、激活稳定、优化器稳定，确保系统稳定运行，在 30 天里完成了 20 万亿 tokens 的训练任务。

性能比较方面，LongCat – Flash 在各大基准测试中表现稳健。在通用任务、复杂推理、数学能力、编程任务等测试中，与国际一线模型水准相当，虽部分测试略低于 Kimi – K2，但优于多数基线模型。

实测方面，美团 LongCat – Flash 虽在性能上未遥遥领先，但速度极快。在处理同样的提示词时，相比 kimi 1.5 能更快输出内容，且核心代码质量相当。

尽管 LongCat – Flash 的速度和价格优势未必能立刻改写行业格局，毕竟大模型市场生态和用户习惯更具粘性，但它透露出美团用“调度运力”逻辑解决复杂科技问题、用价格杠杆撬开市场的信号。美团看似“接地气”的切入点，可能成为搅动格局的变量，其能否靠此在大模型领域取得成功，虽尚无定论，但它已递出了第一张筹码。