“Llama-3”的搜索结果

阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!
阿里巴巴宣布了其历史上最大规模的开源发布,推出了包括基础模型Qwen2.5、编码专用模型Qwen2.5-Coder和数学模型Qwen2.5-Math在内的三大...
闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香
本文是关于阿里云通义千问大模型(Qwen)的一周年回顾和总结。文章首先提到,通义千问在闭源和开源领域都取得了显著成绩,引起了国内外...
重磅!Llama-3,最强开源大模型正式发布!
4月19日,Meta在官网发布了开源大模型Llama-3,包括80亿和700亿两种参数版本,分为基础预训练和指令微调两种模型。相比Llama-2,Llama-3...
Meta公开 Llama-3基础训练设施:使用了49,000个H100
3月13日,Meta宣布推出两个全新的24K H100 GPU集群,用于训练大型模型Llama-3。Llama-3采用RoCEv2网络和基于Tectonic/Hammerspace的NFS/...
Llama-3公布基础训练设施,使用49,000个H100
这篇文章介绍了Meta在AI领域的最新动态。Meta宣布推出两个全新的24K H100 GPU集群,用于训练大型模型Llama-3,预计将于4月末或5月中旬上...
英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了
英伟达最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的大型语言模型,该模型在性能上超越了OpenAI的GPT-4o和Anthropic的Claude-3....
英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1
英伟达最近开源了一款名为Nemotron-70B的AI模型,该模型在多个基准测试中超越了包括GPT-4和Claude 3.5 Sonnet在内的140多个开闭源模型,...
击败GPT-4o、仅次于o1!英伟达重磅开源超强大模型–Nemotron
全球AI领域的领导者英伟达(Nvidia)最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的强大模型,该模型在测试中超越了140多个开闭...
00后国人论文登Nature,大模型对人类可靠性降低
这篇论文探讨了大型语言模型(LLMs)的可靠性问题,发现随着模型规模的增大,其在遵循指令方面的表现反而变得不可靠。研究指出,即使是...
非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造
MIT初创团队Liquid AI推出了一种新型架构模型LFM(Liquid Foundation Model),在性能上超越了同等规模的Transformer模型如Llama3.2。LF...
1 2 3 5