标签:AI推理

GPU危了?老黄200亿挖走的TPU之父,亲口爆料芯片战争终局

英伟达以200亿美元收购AI芯片初创公司Groq的举动,在全球AI领域引发强烈震动。这一价格是Groq三个月前估值的3倍,而Groq的创始人Jonathan Ross正是谷歌TPU的...

无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%

决定AI性能上限的关键因素正从底座模型转向外围的「推理编排」系统。最新研究显示,在大型语言模型(LLM)完全不变的情况下,仅通过优化推理编排系统就能显著...

Meta联手UCSD发布DeepConf:计算成本暴降85%,99.9%准确率!

在人工智能领域,Meta AI 联合加州大学圣地亚哥分校推出的“DeepConf”新技术,为解决 AI 高难度推理难题带来了新突破。该技术解决了让 AI 在高难度推理中保持...

知合计算:打响高性能RISC-V突围战

全球芯片架构经历了三次关键转折:PC时代的x86垄断、移动时代的ARM崛起,以及当前AI与万物互联时代RISC-V的兴起。RISC-V凭借开源、精简、可扩展的特性,逐渐...

SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

中兴通讯凭借40年ICT技术积累正式进军AI赛道,并在中文大模型测评基准SuperCLUE的推理任务中以星云大模型NebulaCoder-V6的优异表现引发行业关注。该模型与字...

边缘AI正当时,Imagination押注GPU的“AI进化”

在人工智能推理逐渐向边缘计算转移的背景下,Imagination推出了全新的E系列GPU IP,旨在通过“AI+图形”深度融合的架构,满足边缘设备对低功耗、高灵活性和强算...

大模型一体机塞进这款游戏卡,价格砍掉一个数量级

大模型一体机中使用的显卡类型引发了广泛关注,尤其是英特尔锐炫™显卡的引入,为市场带来了新的选择。尽管在性能上,搭载NVIDIA显卡的一体机在任务处理速度上...

“再造一个CUDA”:英伟达的第二护城河与“超级碗”阳谋

英伟达2025年3月18日的GTC大会表面上看似平淡,但隐藏了许多细节中的惊喜。黄仁勋发布了关于芯片路线图和其他更新的信息,尽管这些在之前已经被市场预期消化...

DeepSeek开源最后一天,大鹏今日同风起。

DeepSeek在为期五天的开源项目发布中,最终推出了两款核心工具:分布式文件系统3FS与数据处理框架Smallpond。3FS专为AI模型训练与推理设计,采用分离式架构与...

DeepSeek引发推理侧革命,火山引擎凭什么做到最优解?

DeepSeek-R1作为新一代推理模型的代表,对云计算基础设施提出了全方位挑战,推动云服务商在性能、成本和稳定性等维度展开技术竞争。火山引擎凭借20ms内延迟响...
1 2 3 4