标签:性能提升

轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便

这篇文章介绍了上海AI Lab和香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(IXC2-4KHD)模型,这是一个可以自动分析PDF、网页、海报、Excel图表内容...

全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用

Meta公司最近发布了其最新的大型语言模型Llama 3,这是一个在24000块GPU上训练的模型,它在开源大模型中取得了显著的性能提升。Llama 3的8B和70B版本在同规模...

重磅!Llama-3,最强开源大模型正式发布!

4月19日,Meta在官网发布了开源大模型Llama-3,包括80亿和700亿两种参数版本,分为基础预训练和指令微调两种模型。相比Llama-2,Llama-3使用了15T tokens的训...

Llama 3 发布!目前最强开源大模型,全面登陆 Meta 系产品,即将推出 4000 亿模型

Meta公司于本周四正式推出了Llama 3,这是其最新开发的开源大型语言模型,被宣称为“有史以来最强大的开源大模型”。Llama 3模型包含8B(80亿)和70B(700亿)...

Intel推出新芯片,推理性能比英伟达H100快50%

在Vision 2024活动中,Intel宣布了一系列重大消息,包括新款Gaudi 3 AI处理器的详细信息。Intel声称Gaudi 3在训练性能上比英伟达提高了70%,在推理性能上提高...

“梗王”大模型,靠讲笑话登上CVPR | 中山大学

这篇文章介绍了中山大学HCP实验室团队与Sea AI Lab以及哈佛大学合作的研究成果,他们提出了一种新的训练方法CLoT,旨在激发多模态大模型的创造力。首先,团队...

腾讯云 AIGC 存储解决方案全面升级,数据清洗、训练效率翻倍

腾讯云在AIGC场景下的云存储技术发布会上宣布其云存储解决方案全面升级,旨在提高大模型数据清洗和训练效率。新的解决方案使效率提升一倍,时间缩短一半,为A...

Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

Justine Tunney,一位天才程序员和谷歌的工程师,最近通过更新Llamafile的代码,显著提高了Llama的推理速度。她手动编写了84个新的矩阵乘法内核,使得Llamafi...

Scaling Law 又一次性感了吗?

专题解读事件:Sora 的出现被认为是 Scaling Law 的又一次成功,这也引起了社区中更多对 Scaling Law 的讨论。自 OpenAI 发布 Sora,业界对该模型的能力及其...

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书

近期,一项颇为不同寻常的研究引起了广泛关注。研究者们发现,使用百度贴吧中的“弱智吧”数据训练的AI模型,在多项性能测试中取得了出色的成绩,超越了知乎、...
1 3 4 5 6 7 8