两天内，Meta 和 Mistral 两款主流大模型打擂台！已经不仅卷性能了，谁更便宜就用谁？

AIGC动态1年前 (2024)发布 ai-front

2,773 0 0

两天内，Meta 和 Mistral 两款主流大模型打擂台！已经不仅卷性能了，谁更便宜就用谁？

文章摘要

法国AI初创公司Mistral发布了其旗舰级开源模型Mistral Large 2，拥有1230亿个参数，与Meta和OpenAI的最新模型在代码生成、数学和推理方面表现相当。Mistral Large 2在一些基准测试中展现了性能和成本优势。该模型仅授权非商业研究用途，商业应用需付费许可。

Mistral Large 2的上下文窗口增至12.8万个token，支持数十种新语言，包括葡萄牙语、阿拉伯语、印地语等。该模型适合需要强大推理能力或高度专业化任务的场景，如合成文本生成、代码生成等。

Mistral Large 2在训练过程中重点关注减少模型幻觉问题，使其能更敏锐地意识到自己不知道的事情，避免编造看似合理的事情。此外，该模型的响应比领先AI模型更简洁。

在编码能力方面，Mistral Large 2经过大量代码训练，表现优于初版Large模型，与GPT-4o、Claude 3 Opus和Llama 3 405B相当。在推理能力方面，Mistral通过微调模型，减少了产生幻觉的倾向，提高了准确性。

Mistral Large 2在多语言MMLU基准测试中与Meta的Llama 3.1-405B相当，支持80多种编码语言。该模型专为单节点推理设计，适合长上下文类应用场景。

在指令遵循与对齐方面，Mistral Large 2经过微调，能更好地遵循用户指引，处理长时间多轮对话。新模型还经过调优，使答案保持简洁明了。

Mistral已通过API商战平台和云平台开放Mistral Large 2模型访问。在多方面对比中，Mistral Large 2在代码能力和数学基础测试中优于Llama 3.1 405B，在语言多样性方面略逊于Llama 3.1 405B，在推理和指令遵循与对齐方面与Llama 3.1 405B不相上下。

Mistral表示，Mistral Large 2将继续突破成本效率、速度与性能的极限，为用户提供更多新功能。网友对Mistral Large 2的发布表示肯定，认为其在减少幻觉和模型规模方面取得了重要进步。同时，也有网友指出，最好的模型都在向GPT-4类能力靠拢，同时在速度和价格上展开竞争，变得更小、更快、更简洁。