标签:性能测试

Sam Altman泄露新模型o2,太会整活了,营销鬼才!

OpenAI首席执行官Sam Altman发布了一条关于o2模型在GPQA性能测试中达到105%的消息,这一数据远超过人类博士级专家的平均准确率65%和普通人的34%,甚至超过了o...

如何通过KV稀疏实现对vLLM的1.5倍加速

在过去一年中,KV稀疏算法的研究取得了显著进展,但在实际应用中,如何将这些算法与现有的大型语言模型(LLM)框架如vLLM相融合,以提高推理性能,仍是一个挑...

阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!

阿里巴巴宣布了其历史上最大规模的开源发布,推出了包括基础模型Qwen2.5、编码专用模型Qwen2.5-Coder和数学模型Qwen2.5-Math在内的三大类模型。这些模型涵盖...

Contextual AI获8000万美元,为大模型提供RAG 2.0

Contextual AI,一家专注于AIGC领域的专业社区,最近宣布完成了8000万美元的A轮融资。此次融资由多家知名投资机构参与,包括Greycroft、Bain Capital Venture...

从AWS Graviton 4,揭秘Arm Neoverse V2

亚马逊网络服务(AWS)是云服务领域的领导者,也是Arm服务器技术的早期采用者。2018年,AWS推出了Graviton 1,采用16个Cortex A72内核。经过三代发展,Gravit...

GPT-4o mini一手测评:懂得不多,但答得极快

OpenAI 近日推出了一款名为 GPT-4o mini 的新模型,旨在全面取代先前的 GPT-3.5 Turbo。在性能上,GPT-4o mini 在 MMLU 测试中的得分为 82%,在 LMSYS 排行榜...

谷歌推出通用视频模型:能精准分类、定位、检索等

谷歌的研究人员开发了一种名为VideoPrism的通用视频模型,该模型在视频领域的多种任务上展现出了卓越的性能。为了验证VideoPrism的性能,研究人员在33个视频...

中科大等意外发现:大模型不看图也能正确回答视觉问题!

近期,中科大、香港中文大学和上海AI Lab的研究团队发现了一个有趣的现象:即使没有查看图片,一些大型语言模型和多模态模型也能在多模态基准测试MMMU中取得...

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择

新智元最近的报道关注了JAX这一谷歌力推的平台,它在最新的基准测试中表现出色,超越了PyTorch和TensorFlow。这些测试结果表明,JAX在七项指标中排名第一,而...

AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了

Anthropic于3月4日晚发布了新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模。Sonnet版本可免费体验,而最强的Opus版本需付费订阅,...
1 2