标签:性能提升

IEEE:GPU很好,但不是唯一

随着大语言模型的兴起,传统的看法认为GPU在AI应用中占据主导地位,但近期的趋势和实践表明,CPU在很多AI推理场景中展现出了其适用性和优势。权威期刊IEEE Sp...

马斯克的Grok-1.5性能接近GPT-4

Elon Musk 领导的 xAI 公司在发布开源 Grok-1 不久后,宣布了其专有语言模型 LLM Grok-1.5 的升级版。Grok-1.5 预计将在下周发布,其推理和问题解决能力有了...

LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」

谷歌团队在ICLR 2024上提出了一种将图形数据转换为适合LLMs理解的形式的方法。在计算机科学领域,图形结构由节点(代表实体)和边(表示实体之间的关系)构成...

清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星

清华大学和微软的研究人员提出了一种名为LLMLingua-2的新型文本压缩方法,该方法能够在保证输出质量不变的情况下,将提示词压缩至原始长度的20%。与现有基于...

模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

这篇文章介绍了日本大模型公司提出的一种新颖的模型合并方法,旨在自动生成新的基础模型而无需进行梯度训练。他们使用进化算法引入了“进化模型合并”(Evoluti...

CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术

视频理解技术旨在准确把握视频中的时空信息,但面临着短视频片段的时空冗余和复杂时空依赖关系的双重挑战。传统的三维卷积神经网络(CNN)和视频Transformer...

零一万物 API 上线,用户反馈多模态中文图表体验超过 GPT-4V

零一万物公司近日发布了Yi大模型API开放平台,为开发者提供通用Chat、200k超长上下文、多模态交互等模型。零一万物由李开复创办于2023年6月,成功发布了Yi系...

老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代

英伟达在GTC人工智能大会上发布了其最新一代性能巨兽——Blackwell B200 GPU和GB200超级芯片。这款芯片被命名为Blackwell,以纪念著名数学家David Blackwell对...

向量数据库王冠易主!零一万物新成果登顶权威榜单,比前SOTA领先最高286%

文章介绍了零一万物最新研发的高性能向量数据库笛卡尔在向量数据库排行榜上的表现。笛卡尔成功登顶权威测评榜单,并包揽了六个数据集的第一名,其中在一些数...
1 4 5 6 7 8