提前曝光 Llama 3.1,Meta 为什么想做「大模型界 Linux」?

AIGC动态5个月前发布 geekpark
805 0 0
提前曝光 Llama 3.1,Meta 为什么想做「大模型界 Linux」?

 

文章摘要


【关 键 词】 Llama 3.1开源AIMeta AIAI助手技术投资

Meta于7月23日开源了备受期待的大型参数模型Llama 3.1,该模型在多项基准测试中表现优于GPT-4o和Anthropic的Claude 3.5 Sonnet。Llama 3.1拥有4050亿个模型参数,采用了密集Transformer架构,具有128K的上下文窗口。与去年发布的Llama 2相比,Llama 3.1在数据使用、训练规模和复杂性管理等方面都有显著提升。然而,尽管Llama 3.1开源,但其4000亿参数量级的密集模型对运行算力集群的复杂性和高成本提出了挑战,真正能够使用该模型的开发者并不多。

Llama 3.1在通用、编程和多语言能力等方面表现优异,但目前还不支持多模态融合,Meta正在积极开发具有图像识别、视频识别和语音理解功能的版本。扎克伯格认为,开源AI将成为行业标准,Meta有机会成为大模型时代的Linux。Meta通过建立广泛、开放的生态系统,致力于使Llama成为行业标准。

尽管Llama 3.1的开源为开发者提供了一个强大的基座模型,但其运行成本和部署复杂性可能成为挑战。Meta已经与生态伙伴合作,提供支持开发者部署Llama 3.1的方案,但仍可能面临多节点推理的复杂性和成本问题。扎克伯格表示,他乐于看到人们使用Llama 3.1进行微调和蒸馏,以创建适合特定需求的小型模型。

Meta AI作为Meta应用程序和智能眼镜中的AI助手,将受益于Llama 3.1的支持。扎克伯格预测,到今年年底,Meta AI的使用量将超过ChatGPT,成为使用最广泛的AI助手。Meta的愿景是让每个创作者和企业都能创建自己的AI代理,以满足不同需求。Llama 4已经在开发中,Meta将继续投资于AI技术,以实现其产品愿景和商业机会。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 4192字 | 17分钟 ]
【原文作者】 极客公园
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...