标签:性能提升
GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo
SenseChat Lite:轻量级端侧大模型1. 性能对比:在《街头霸王》游戏中,SenseChat Lite与GPT-4进行了一场PK,展示了其快速反应能力。尽管GPT-4还在决策中,Se...
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
这篇文章介绍了上海AI Lab和香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(IXC2-4KHD)模型,这是一个可以自动分析PDF、网页、海报、Excel图表内容...
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
Meta公司最近发布了其最新的大型语言模型Llama 3,这是一个在24000块GPU上训练的模型,它在开源大模型中取得了显著的性能提升。Llama 3的8B和70B版本在同规模...
重磅!Llama-3,最强开源大模型正式发布!
4月19日,Meta在官网发布了开源大模型Llama-3,包括80亿和700亿两种参数版本,分为基础预训练和指令微调两种模型。相比Llama-2,Llama-3使用了15T tokens的训...
Llama 3 发布!目前最强开源大模型,全面登陆 Meta 系产品,即将推出 4000 亿模型
Meta公司于本周四正式推出了Llama 3,这是其最新开发的开源大型语言模型,被宣称为“有史以来最强大的开源大模型”。Llama 3模型包含8B(80亿)和70B(700亿)...
Intel推出新芯片,推理性能比英伟达H100快50%
在Vision 2024活动中,Intel宣布了一系列重大消息,包括新款Gaudi 3 AI处理器的详细信息。Intel声称Gaudi 3在训练性能上比英伟达提高了70%,在推理性能上提高...
“梗王”大模型,靠讲笑话登上CVPR | 中山大学
这篇文章介绍了中山大学HCP实验室团队与Sea AI Lab以及哈佛大学合作的研究成果,他们提出了一种新的训练方法CLoT,旨在激发多模态大模型的创造力。首先,团队...
腾讯云 AIGC 存储解决方案全面升级,数据清洗、训练效率翻倍
腾讯云在AIGC场景下的云存储技术发布会上宣布其云存储解决方案全面升级,旨在提高大模型数据清洗和训练效率。新的解决方案使效率提升一倍,时间缩短一半,为A...
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核
Justine Tunney,一位天才程序员和谷歌的工程师,最近通过更新Llamafile的代码,显著提高了Llama的推理速度。她手动编写了84个新的矩阵乘法内核,使得Llamafi...
Scaling Law 又一次性感了吗?
专题解读事件:Sora 的出现被认为是 Scaling Law 的又一次成功,这也引起了社区中更多对 Scaling Law 的讨论。自 OpenAI 发布 Sora,业界对该模型的能力及其...