
文章摘要
MiniMax近期在X平台上预告了一整周的发布计划,首日推出了开源推理模型MiniMax M1,这一模型在多个评测集上表现优异,尤其在上下文处理能力上取得了显著突破。MiniMax M1的上下文能力被认为足以媲美Gemini 2.5 Pro,成为开源模型中的佼佼者。在AIME 2024逻辑数学题目、LiveCodeBench编程题以及SWE-bench Verified等评测中,M1的表现中规中矩,但在TAU-bench和MRCR(4-needle)评测中,M1的表现尤为突出,尤其是在MRCR评测中,M1几乎与Gemini 2.5 Pro并驾齐驱,展现了其在多轮对话和复杂上下文处理中的强大能力。
MRCR(Multi-Round Co-reference Resolution)评测主要考察模型在多轮对话中能否准确理解和区分用户的具体要求,这一评测对模型的上下文理解力提出了极高的要求。MiniMax M1在这一评测中的出色表现,得益于其基座模型MiniMax-01的Lightning Attention线性注意力机制,该机制使得M1的时间和空间复杂度随序列长度增加近似线性增长,显著降低了计算资源的消耗。M1的上下文长度可达100万字,是DeepSeek R1的8倍,且在处理64K token时,FLOPs消耗不到DeepSeek R1的一半。
MiniMax M1的开源版本提供了40K和80K两种上下文长度的推理模型,80K版本是在40K版本基础上进一步训练得到的增强版本。M1的超长上下文处理能力为其带来了多种创新应用场景,如文档翻译、聊天记录分析、科幻小说总结等。在翻译任务中,M1不仅能够准确翻译文字,还能处理图表和公式,展现了其在复杂文档处理中的强大能力。此外,M1在编程和数学任务中也表现不俗,尽管在前端审美上仍有提升空间,但其整体性能已经达到了开源模型的新高度。
MiniMax的这一系列发布不仅展示了其在AI领域的技术实力,也为开源社区带来了新的活力。随着MiniMax Week的继续推进,业界对MiniMax未来发布的期待也在不断升温,尤其是在视频模型和音乐模型等领域的潜在突破。MiniMax的持续创新和开源贡献,无疑将进一步推动AI技术的发展和应用。
原文和模型
【原文链接】 阅读原文 [ 2572字 | 11分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆