标签:性能测试

Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek

市场反馈显示,该功能与普通AI搜索形成明显差异:普通搜索侧重快速获取表面信息,而Deep Research专攻多层次的深度分析,处理时间从5分钟到半小时不等。用户...

最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版

DeepSeek-R1是一款正在接受全球网友检验的人工智能模型,它能够通过manim代码快速制作解释勾股定理的动画。为了运行这个模型,有用户投资超过10万元,组建了...

医疗复杂推理开源大模型——华佗GPT-o1

香港中文大学(深圳)和深圳市大数据研究院联合开源了一款专用于医疗领域的复杂大模型——华佗GPT-o1,旨在辅助医生进行更高效的推理。该模型的开发基于高质量...

现在的技术条件,运行100万个并发任务需要多少内存?

在2024年的基准测试中,针对不同编程语言的异步编程内存消耗进行了重新评估。测试程序启动N个并发任务,每个任务等待10秒后程序退出,重点关注协程而非多线程...

Sam Altman泄露新模型o2,太会整活了,营销鬼才!

OpenAI首席执行官Sam Altman发布了一条关于o2模型在GPQA性能测试中达到105%的消息,这一数据远超过人类博士级专家的平均准确率65%和普通人的34%,甚至超过了o...

如何通过KV稀疏实现对vLLM的1.5倍加速

在过去一年中,KV稀疏算法的研究取得了显著进展,但在实际应用中,如何将这些算法与现有的大型语言模型(LLM)框架如vLLM相融合,以提高推理性能,仍是一个挑...

阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!

阿里巴巴宣布了其历史上最大规模的开源发布,推出了包括基础模型Qwen2.5、编码专用模型Qwen2.5-Coder和数学模型Qwen2.5-Math在内的三大类模型。这些模型涵盖...

Contextual AI获8000万美元,为大模型提供RAG 2.0

Contextual AI,一家专注于AIGC领域的专业社区,最近宣布完成了8000万美元的A轮融资。此次融资由多家知名投资机构参与,包括Greycroft、Bain Capital Venture...

从AWS Graviton 4,揭秘Arm Neoverse V2

亚马逊网络服务(AWS)是云服务领域的领导者,也是Arm服务器技术的早期采用者。2018年,AWS推出了Graviton 1,采用16个Cortex A72内核。经过三代发展,Gravit...

GPT-4o mini一手测评:懂得不多,但答得极快

OpenAI 近日推出了一款名为 GPT-4o mini 的新模型,旨在全面取代先前的 GPT-3.5 Turbo。在性能上,GPT-4o mini 在 MMLU 测试中的得分为 82%,在 LMSYS 排行榜...
1 2