标签:AI推理

AI 推理竞赛正在升温

在AI推理领域,尽管英伟达的GPU保持着其在AI训练领域的领导地位,但竞争对手正在迅速追赶,尤其是在能效方面。最近,ML Commons发布了MLPerf Inference v4.1...

英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生

MLCommons发布了MLPerf Inference v4.1的最新测试结果,其中英伟达的Blackwell架构芯片在大语言模型(LLM)推理任务中表现出色,刷新了部分任务的测试纪录。M...

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

Cerebras公司最近推出了全球最快的AI推理架构——Cerebras Inference,其推理速度远超当前最先进的GPU。在运行Llama3.1 8B模型时,Cerebras Inference能够以180...

Fireworks 乔琳:AI 产品上市时间从五年压缩到五天,我们的秘诀是什么?

Fireworks AI是一家提供生成式人工智能(GenAI)推理和调优服务的SaaS平台,其目标是为客户提供快速、经济、高度定制化的解决方案。公司在7月完成B轮融资,筹...

OpenAI 的 Q*没见过,一众创业公司的 Q*来了

去年,OpenAI的研究人员向董事会发出联名信,指出代号为Q*的神秘项目可能会威胁全人类。尽管Q*项目尚未公开,但其传言一直存在。谷歌DeepMind资深工程师卢一...

谷歌AI一分之差痛失IMO金牌!19秒做一题碾压人类选手,几何AI超进化震撼评委

谷歌DeepMind的人工智能系统在国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其中AI系统AlphaProof和AlphaGeometry 2成功完成了6道题目中的4道,获得了相当...

OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑

OpenAI的新项目「草莓」(Strawberry)被曝光,该项目旨在提高AI模型的推理能力,使其能够提前计划、自主浏览网页并进行深度研究。Strawberry模型在大量通用数...

IEEE:GPU很好,但不是唯一

随着大语言模型的兴起,传统的看法认为GPU在AI应用中占据主导地位,但近期的趋势和实践表明,CPU在很多AI推理场景中展现出了其适用性和优势。权威期刊IEEE Sp...
1 2