Meta重磅开源Llama 3.3-70B：性能大涨成本降10倍

AIGC动态1年前 (2024)发布 AIGCOPEN

2,420 0 0

文章摘要

Meta最近宣布开源其最新的大型语言模型Llama 3.3-70B，尽管参数数量仅为700亿，但其性能与之前开源的Llama 3.1 4050亿参数模型相当，同时显著降低了推理和部署成本，输入成本降低10倍，输出成本降低近5倍。性能测试数据表明，Llama 3.3 70B在多个行业基准测试中超越了谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o和亚马逊的Nova Pro，特别是在评估模型语言理解能力的MMLU测试中。Meta发言人指出，该模型将在数学、常识、指令遵循和应用使用等领域带来显著改进。

Meta内部也在积极利用Llama模型，完全由Llama模型驱动的Meta AI助手每月活跃用户接近6亿。Meta首席执行官马克·扎克伯格表示，Meta AI有望成为全球使用最广泛的AI助手。为了提升大模型训练设施，Meta宣布将在路易斯安那州建立一个100亿美元的AI数据中心，这是其历史上最大的AI数据中心，投资规模超过马斯克的xAI。扎克伯格在Meta第四季度财报电话会议上提到，为了训练下一代主要的Llama模型Llama 4，公司将需要比训练Llama 3多10倍的计算能力，显示出训练大型语言模型的成本之高。Meta的资本支出在2024年第二季度增长了近33%，从一年前的64亿美元增至85亿美元，主要由于对服务器、数据中心和网络基础设施的投资。