文章摘要
【关 键 词】 芯片过热、设计变更、散热难题、AI芯片竞争、市场预测
英伟达的下一代Blackwell芯片在高密度服务器机架中遭遇严重过热问题,导致设计变更和部署延迟,引发Google、Meta和微软等主要客户对按时部署的担忧。Blackwell GPU原计划2024年第二季度发货,但已因设计缺陷推迟。高密度服务器机架集成72块AI芯片,功耗高达120kW,散热难题限制了GPU性能,可能损坏硬件。英伟达已调整机架设计和冷却系统,指示供应商改进。客户如微软考虑定制Blackwell机架,增加Hopper芯片采购量,短期内可能提升英伟达收入,但可能削弱未来对Blackwell的需求。
Blackwell芯片自发布以来市场需求和关注度高,在MLPerf Training 4.1基准测试中展现领先性能。英伟达预计2025年第一季度Blackwell新产品线将提升公司收入50-60亿美元。随着Blackwell预计于2025年1月底大规模交付,其实际表现将成为观察重点。
与此同时,AMD加速进军AI芯片市场,推出新款AI芯片Instinct MI325X,计划2024年底前生产。AMD的MI325X是MI300X的继任者,计划每年发布一款新芯片,以缩小与英伟达的差距。AMD预计到2028年AI芯片市场规模将达5000亿美元。MI325X在处理Meta的Llama 3.1模型时推理性能比Nvidia H200高出40%。AMD强调其芯片在生成内容和预测类AI应用中具有优势。尽管英伟达的CUDA语言已成为AI开发的事实标准,但随着云巨头对AI需求的增长,AMD有机会通过差异化策略吸引更多客户。
原文和模型
【原文链接】 阅读原文 [ 1433字 | 6分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆