新版Llama 3 70B反超405B！Meta开卷后训练，谷歌马斯克都来抢镜

1,595 0 0

文章摘要

【关键词】 大模型更新、Meta Llama、谷歌Gemini、xAI Grok、技术竞争

近期，大模型领域迎来了一系列重要更新。Meta发布了Llama 3.3，这是一个70B参数的模型，其性能在多个领域超越了之前405B参数的Llama 3.1。Llama 3.3在指令遵循、数学和推理等领域的表现尤为突出，而在语言、代码和多语种能力上也接近Llama 3.1 405B。尽管在工具使用方面与405B版本有差距，但Llama 3.3的使用成本显著降低，其价格为0.1/0.4美元每百万输入/输出Token，远低于Llama 3.1 405B的1美元和1.8美元。Meta AI团队领导者Ahmad Al-Dahle指出，Llama 3.3的性能提升得益于后训练技术的最新进展，包括在线偏好优化和在线强化学习技术。模型权重已在官网和Hugging Face上开放下载。

谷歌的Gemini模型也迎来了更新，Gemini 1206在一周岁生日之际上线，并在lmsys大模型竞技场的总成绩和多个单项排名中夺冠。Gemini 1206拥有2百万token的上下文窗口，目前可通过谷歌AI Studio和Gemini API免费使用。

此外，马斯克的xAI公司被传即将发布Grok 3，尽管具体消息尚未公布，但Grok目前已对所有用户免费开放，尽管免费用户的使用量有限。在这个发布密集的十二月，大模型领域的竞争愈发激烈，各公司的新模型和更新不断推动着技术的发展和应用。