文章摘要
【关 键 词】 大模型更新、Meta Llama、谷歌Gemini、xAI Grok、技术竞争
近期,大模型领域迎来了一系列重要更新。Meta发布了Llama 3.3,这是一个70B参数的模型,其性能在多个领域超越了之前405B参数的Llama 3.1。Llama 3.3在指令遵循、数学和推理等领域的表现尤为突出,而在语言、代码和多语种能力上也接近Llama 3.1 405B。尽管在工具使用方面与405B版本有差距,但Llama 3.3的使用成本显著降低,其价格为0.1/0.4美元每百万输入/输出Token,远低于Llama 3.1 405B的1美元和1.8美元。Meta AI团队领导者Ahmad Al-Dahle指出,Llama 3.3的性能提升得益于后训练技术的最新进展,包括在线偏好优化和在线强化学习技术。模型权重已在官网和Hugging Face上开放下载。
谷歌的Gemini模型也迎来了更新,Gemini 1206在一周岁生日之际上线,并在lmsys大模型竞技场的总成绩和多个单项排名中夺冠。Gemini 1206拥有2百万token的上下文窗口,目前可通过谷歌AI Studio和Gemini API免费使用。
此外,马斯克的xAI公司被传即将发布Grok 3,尽管具体消息尚未公布,但Grok目前已对所有用户免费开放,尽管免费用户的使用量有限。在这个发布密集的十二月,大模型领域的竞争愈发激烈,各公司的新模型和更新不断推动着技术的发展和应用。
原文和模型
【原文链接】 阅读原文 [ 886字 | 4分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...