新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

AIGC动态2周前发布 QbitAI
137 0 0
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

 

文章摘要


【关 键 词】 大模型更新Meta Llama谷歌GeminixAI Grok技术竞争

近期,大模型领域迎来了一系列重要更新。Meta发布了Llama 3.3,这是一个70B参数的模型,其性能在多个领域超越了之前405B参数的Llama 3.1。Llama 3.3在指令遵循、数学和推理等领域的表现尤为突出,而在语言、代码和多语种能力上也接近Llama 3.1 405B。尽管在工具使用方面与405B版本有差距,但Llama 3.3的使用成本显著降低,其价格为0.1/0.4美元每百万输入/输出Token,远低于Llama 3.1 405B的1美元和1.8美元。Meta AI团队领导者Ahmad Al-Dahle指出,Llama 3.3的性能提升得益于后训练技术的最新进展,包括在线偏好优化和在线强化学习技术。模型权重已在官网和Hugging Face上开放下载。

谷歌的Gemini模型也迎来了更新,Gemini 1206在一周岁生日之际上线,并在lmsys大模型竞技场的总成绩和多个单项排名中夺冠。Gemini 1206拥有2百万token的上下文窗口,目前可通过谷歌AI Studio和Gemini API免费使用。

此外,马斯克的xAI公司被传即将发布Grok 3,尽管具体消息尚未公布,但Grok目前已对所有用户免费开放,尽管免费用户的使用量有限。在这个发布密集的十二月,大模型领域的竞争愈发激烈,各公司的新模型和更新不断推动着技术的发展和应用。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 886字 | 4分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...