Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了

AIGC动态5天前发布 ai-front
295 0 0
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了

 

文章摘要


【关 键 词】 AI模型开源性能基准测试创新

英伟达于4月8日发布了最新大语言模型Llama3.1 Nemotron Ultra 253B,该模型基于Meta的Llama-3.1-405B-Instruct构建,并通过神经架构搜索(NAS)技术进行了深度优化。其性能超越了近期发布的Llama4,并在Hugging Face平台上开源,引发了AI社区的广泛关注。Meta作为大模型开源领域的领头羊,近期发布的Llama4却因多个问题陷入争议,尤其是“作弊”事件,极大损害了公众信任。Meta在LMArena平台上提交了一个经过优化的实验性聊天版本Maverick,而非公开版本,导致评测结果与公开发布版本存在显著差异,引发了信任危机。

Meta的这一行为被批评为“操纵评测系统”,尽管未明确违反LMArena的规则,但平台已采取措施防止类似事件再次发生。 Meta发言人回应称,实验性版本是为了优化聊天性能,并已发布开源版本供开发者定制。然而,这一事件揭示了Meta在AI领域的研发困境,尤其是在面对DeepSeek等开源模型的竞争时,Meta的技术优势逐渐减弱。

Llama4的发布过程并不顺利,多次推迟发布,且未能达到内部预期。Meta内部对DeepSeek的开源模型感到恐慌,工程师们试图复制其技术以提升Llama4的性能。尽管Meta宣称Maverick在多项基准测试中超越了GPT-4o和Gemma 2.0,但第三方评测显示,Llama4在实际使用中表现不佳,尤其是在长上下文处理方面。

网友和研究人员对Llama4的评价褒贬不一,部分人认为其架构复杂且具有创新性,尤其是在多模态和推理设计方面,但也有不少人指出其在落地时存在诸多问题,需要进一步优化。 尽管Llama4在部分评测中表现优异,但其实际应用中的表现与评测结果存在较大差距,导致公众对其真实能力持怀疑态度。

总体而言,Llama4的发布暴露了Meta在AI领域的技术瓶颈和竞争压力。尽管其在开源模型生态中仍具有重要价值,但面对日益激烈的市场竞争,Meta需要进一步提升模型的实际性能,以维持其行业领先地位。

原文和模型


【原文链接】 阅读原文 [ 3253字 | 14分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3/community
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...