面壁小钢炮 3.0 重磅发布！“无限”长文本，性能超 Kimi

2,082 0 0

文章摘要

【关键词】 MiniCPM 3.0、端侧模型、长文本处理、RAG技术、AI大会

面壁智能最近宣布了其旗舰端侧模型“小刚炮”系列的升级，推出了全新的MiniCPM 3.0基座模型。这一新模型以4B参数实现了超越GPT-3.5的性能，同时量化后仅占用2GB内存，显示出对端侧设备的友好性。MiniCPM 3.0的主要特点包括无限长文本处理能力，其榜单性能超越了Kimi，即使在处理超长文本时也不会崩溃。此外，它还具备与GPT-4o相媲美的端侧Function Calling性能，以及在中文检索和生成方面超越Llama3-8B的超强RAG外挂三件套。

面壁智能团队提前四个月实现了他们的目标，即在端侧运行达到GPT-3.5水平的模型。MiniCPM 3.0在自然语言理解、知识、代码、数学等多项能力上超越了GPT-3.5，并在多个中外知名模型中脱颖而出。面壁团队构建了全新的技术架构，以Scaling Law为核心，将提升知识密度视为高效大模型的第一性原理，并提出了“面壁定律”，即模型知识密度平均每8个月提升一倍。

MiniCPM 3.0集成了长文本处理、Function Call和RAG等大模型的重要能力。面壁提出的LLMxMapReduce长文本分帧处理技术，实现了“无限”长文本的处理能力。在InfiniteBench大模型长文本能力的权威评测集中，MiniCPM 3.0在多维度能力评估中超越了GPT-4、KimiChat、Qwen2-70B等模型。

在Function Calling方面，MiniCPM 3.0在Berkeley Function-Calling Leaderboard上的评测中接近GPT-4o的性能，并超越了多个其他模型。RAG技术的应用使得端侧模型能够引用外部知识库，提高了生成内容的可信度，并减少了大模型的幻觉问题。面壁智能提供的RAG外挂三件套包括MiniCPM-Embedding（检索模型）、MiniCPM-Reranker（重排序模型）和LoRA插件（生成模型），在多项任务上的性能超越了业内其他优秀模型。

此外，AICon全球人工智能开发与应用大会·上海站成功举办，汇聚了超过60位大模型行业先锋，深入探讨了大模型训练与推理机制、多模态融合、智能体Agent前沿进展等热点话题。《中国AI Agent应用研究报告 2024》则提供了关于AI Agent应用现状和未来发展的深入分析。