标签:性能提升
重磅!Llama-3,最强开源大模型正式发布!
4月19日,Meta在官网发布了开源大模型Llama-3,包括80亿和700亿两种参数版本,分为基础预训练和指令微调两种模型。相比Llama-2,Llama-3使用了15T tokens的训...
Llama 3 发布!目前最强开源大模型,全面登陆 Meta 系产品,即将推出 4000 亿模型
Meta公司于本周四正式推出了Llama 3,这是其最新开发的开源大型语言模型,被宣称为“有史以来最强大的开源大模型”。Llama 3模型包含8B(80亿)和70B(700亿)...
Intel推出新芯片,推理性能比英伟达H100快50%
在Vision 2024活动中,Intel宣布了一系列重大消息,包括新款Gaudi 3 AI处理器的详细信息。Intel声称Gaudi 3在训练性能上比英伟达提高了70%,在推理性能上提高...
“梗王”大模型,靠讲笑话登上CVPR | 中山大学
这篇文章介绍了中山大学HCP实验室团队与Sea AI Lab以及哈佛大学合作的研究成果,他们提出了一种新的训练方法CLoT,旨在激发多模态大模型的创造力。首先,团队...
腾讯云 AIGC 存储解决方案全面升级,数据清洗、训练效率翻倍
腾讯云在AIGC场景下的云存储技术发布会上宣布其云存储解决方案全面升级,旨在提高大模型数据清洗和训练效率。新的解决方案使效率提升一倍,时间缩短一半,为A...
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核
Justine Tunney,一位天才程序员和谷歌的工程师,最近通过更新Llamafile的代码,显著提高了Llama的推理速度。她手动编写了84个新的矩阵乘法内核,使得Llamafi...
Scaling Law 又一次性感了吗?
专题解读事件:Sora 的出现被认为是 Scaling Law 的又一次成功,这也引起了社区中更多对 Scaling Law 的讨论。自 OpenAI 发布 Sora,业界对该模型的能力及其...
弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书
近期,一项颇为不同寻常的研究引起了广泛关注。研究者们发现,使用百度贴吧中的“弱智吧”数据训练的AI模型,在多项性能测试中取得了出色的成绩,超越了知乎、...
IEEE:GPU很好,但不是唯一
随着大语言模型的兴起,传统的看法认为GPU在AI应用中占据主导地位,但近期的趋势和实践表明,CPU在很多AI推理场景中展现出了其适用性和优势。权威期刊IEEE Sp...
马斯克的Grok-1.5性能接近GPT-4
Elon Musk 领导的 xAI 公司在发布开源 Grok-1 不久后,宣布了其专有语言模型 LLM Grok-1.5 的升级版。Grok-1.5 预计将在下周发布,其推理和问题解决能力有了...