“CUDA”的搜索结果

GPU,警钟敲响!
Nvidia的GPU在2023年经历了显著增长,数据中心GPU出货量达到约376万台,相较于2022年的264万台增长了100多万台。此外,2024年第二季度的...
万字探讨:国内AI应用创业陷入恶性循环,问题在哪里,出路是什么?
自ChatGPT引领的大型语言模型(LLM)发展以来,其对人类社会的深远影响已成为共识。在行业巨头和资本的推动下,LLM及其应用如聊天机器人...
全球最大芯片,进军推理:1800 token/秒,全球最快
Cerebras Systems,一家以挑战英伟达在AI芯片市场地位为目标的公司,于今年年初推出了WSE-3 AI芯片,专为训练大型AI模型而设计。这款基...
Fireworks 乔琳:AI 产品上市时间从五年压缩到五天,我们的秘诀是什么?
Fireworks AI是一家提供生成式人工智能(GenAI)推理和调优服务的SaaS平台,其目标是为客户提供快速、经济、高度定制化的解决方案。公司...
论文荣登计算机体系结构顶会ISCA,芯片架构成为边缘AI最佳并行计算选择
随着AI大模型的快速发展,对GPU的需求不断增长,同时边缘AI应用的兴起也推动了边缘AI服务器和加速处理器市场的增长。在众多计算架构中,...
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1
阿布扎比技术创新研究所(TII)发布了一款名为Falcon Mamba 7B的新型开源Mamba架构模型,该模型自2023年12月首次推出以来,已成为Transf...
新PyTorch API:几行代码实现不同注意力变体,兼具FlashAttention性能和PyTorch灵活性
机器之心报道了PyTorch团队为解决注意力机制实现中的超立方体问题而引入的FlexAttention。注意力机制在机器学习中至关重要,但现有的实...
买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100
特斯拉CEO埃隆·马斯克(Elon Musk)一直在积极推动公司在人工智能领域的雄心,其中Dojo超级计算机是其核心项目之一。Dojo旨在为特斯拉的全...
一夜暴降1.4万亿,AI芯片巨头英伟达迎来至暗时刻?|钛媒体AGI
苹果公司最新发布的研究论文揭示了其AI大模型技术主要依赖谷歌TPU和英伟达GPU芯片进行训练和构建。然而,英伟达CEO黄仁勋近期大规模抛售...
3万亿芯片公司,也在夹缝求生?
英伟达正在为中国市场开发一款新的AI芯片,以符合美国出口管制的要求。这款名为“B20”的芯片预计将与浪潮集团合作推出,可能具备B200芯片...
1 2 3 4 8