Meta重磅开源Llama 3.3-70B:性能大涨成本降10倍

AIGC动态2周前发布 AIGCOPEN
142 0 0
Meta重磅开源Llama 3.3-70B:性能大涨成本降10倍

 

文章摘要


【关 键 词】 Meta开源Llama模型性能提升AI助手数据中心

Meta最近宣布开源其最新的大型语言模型Llama 3.3-70B,尽管参数数量仅为700亿,但其性能与之前开源的Llama 3.1 4050亿参数模型相当,同时显著降低了推理和部署成本,输入成本降低10倍,输出成本降低近5倍。性能测试数据表明,Llama 3.3 70B在多个行业基准测试中超越了谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o和亚马逊的Nova Pro,特别是在评估模型语言理解能力的MMLU测试中。Meta发言人指出,该模型将在数学、常识、指令遵循和应用使用等领域带来显著改进。

Meta内部也在积极利用Llama模型,完全由Llama模型驱动的Meta AI助手每月活跃用户接近6亿。Meta首席执行官马克·扎克伯格表示,Meta AI有望成为全球使用最广泛的AI助手。为了提升大模型训练设施,Meta宣布将在路易斯安那州建立一个100亿美元的AI数据中心,这是其历史上最大的AI数据中心,投资规模超过马斯克的xAI。扎克伯格在Meta第四季度财报电话会议上提到,为了训练下一代主要的Llama模型Llama 4,公司将需要比训练Llama 3多10倍的计算能力,显示出训练大型语言模型的成本之高。Meta的资本支出在2024年第二季度增长了近33%,从一年前的64亿美元增至85亿美元,主要由于对服务器、数据中心和网络基础设施的投资。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 465字 | 2分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...