Mistral新旗舰决战Llama 3.1！最强开源Large 2 123B，扛鼎多语言编程全能王

AIGC动态1年前 (2024)发布 AIera

2,585 0 0

Mistral新旗舰决战Llama 3.1！最强开源Large 2 123B，扛鼎多语言编程全能王

文章摘要

【关键词】 开源AI、Mistral Large 2、高效运行、多语言处理、商业应用

新智元报道了开源AI领域的最新进展，其中Mistral Large 2模型的发布引起了广泛关注。该模型以其123B的参数量，远低于Llama 3.1的405B，实现了在单个节点上的高效运行，同时在编码、数学和多语言等专业领域展现出与现有最先进模型（SOTA）相媲美的能力。Mistral Large 2的发布，为个人开发者和研究者提供了一个成本效率更高、速度更快且性能优越的AI模型选择。

Llama 3.1模型虽然在AI社区中引起了兴奋，但其庞大的参数规模使得个人开发者难以在本地运行。有用户尝试使用英伟达4090显卡运行Llama 3.1，却发现模型需要20小时才能给出完整回应。相比之下，Mistral Large 2的参数量减少到Llama 3.1的三分之一，使得本地部署变得更加可行。

Mistral Large 2在代码生成、数学推理等方面的表现尤为出色。它支持80多种编程语言，并且在代码生成基准测试中，其表现优于Claude 3.5 Sonnet和Llama 3.1，仅次于GPT-4o。在数学基准测试中，Mistral Large 2也展现出了强大的推理和解决问题的能力。

此外，Mistral Large 2在指令执行和对话能力上也有所提升，特别是在执行精确指令和处理长时间多轮对话方面。它在Wild Bench和Arena Hard等通用对齐基准测试上的表现令人印象深刻。Mistral Large 2还能够生成更简洁的响应，这对于商业应用来说是一个重要的优势。

在多语言处理方面，Mistral Large 2同样表现出色。它在法语、德语、西班牙语等多种语言上的MMLU基准测试中都有出色的表现，与Llama 3.1 405B的性能相当。这使得Mistral Large 2成为处理多语言文档的理想选择。

Mistral Large 2还具备强大的函数调用和检索能力，能够熟练执行并行和顺序的函数调用，准确率甚至超过了GPT-4o。这使得Mistral Large 2有潜力成为复杂商业应用的核心引擎。

Mistral Large 2的模型权重已经托管在HuggingFace仓库中，向研究和非商业用途开放。用户可以通过官方API平台la Plateforme访问或微调模型，也可以通过Vertex AI、Azure Studio等第三方云平台使用Mistral Large 2的API。

总的来说，Mistral Large 2的发布为开源AI领域带来了一款性能卓越、成本效率高、易于部署的AI模型。它在代码生成、数学推理、指令执行、多语言处理等方面的出色表现，使其成为个人开发者、研究者和商业应用的理想选择。随着Mistral Large 2的推出，开源AI领域的竞争愈发激烈，为推动AI技术的发展和应用提供了更多可能性。