老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

AIGC动态7个月前发布 AIera
1,122 0 0
老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

 

文章摘要


【关 键 词】 技术展示芯片突破能效优化计算变革AI工厂

在最新的技术展示中,老黄展示了Blackwell,这是迄今为止世界上最大的芯片。他宣称,这款芯片能够在8年内将1.8万亿参数GPT-4的训练能耗大幅削减至1/350,而推理能耗更是降低至1/45000。这一突破性的进展使得英伟达的产品迭代速度远超摩尔定律的预期。

同时,老黄还透露了Blackwell的后三代路线图,包括Blackwell Ultra(2025年)、Rubin(2026年)和Rubin Ultra(2027年)。他提出了“买得越多,省得越多”的黄式数学公式,预示着计算成本与效率的进一步优化。

在演讲中,老黄强调了英伟达正处于计算机图形模拟和人工智能的交叉点上,这是公司的核心所在。他回顾了计算机行业60多年的发展历程,认为我们现在正处于一个全新计算时代的开端。从1964年IBM的System 360首次引入CPU,到1995年PC革命,再到2007年iPhone的推出,技术的进步不断推动着计算行业的变革。

老黄指出,我们现在面临的最基础的技术变革包括处理器性能扩展的放缓和指数级增长的数据处理需求。他提出了“计算通货膨胀”的概念,并介绍了英伟达如何通过加速计算和人工智能来应对这一挑战。CUDA的出现加速了CPU负载,英伟达通过异构计算实现了100倍的速度提升,而功耗仅增加3倍,成本也只有原来的1.5倍。

此外,英伟达为价值十亿美元的数据中心配备了5亿美元的GPU,将其转变为AI工厂。CUDA软件的专用性使得各种计算任务得以加速,从深度学习到数据处理等各个领域。CUDA的生态系统已经遍布全球,上周谷歌宣布将cuDF加入谷歌云,进一步加速数据处理速度。

老黄强调,要推广一个全新的平台需要开发者和用户的共同参与,CUDA已经成功打破了这一“蛋和鸡”的困境,形成了良性循环。随着越来越多的开发者和用户加入,CUDA的性能将不断提升,为计算密集型应用带来更高效、更节能的解决方案。这标志着“AI工厂”全栈重塑,预示着计算行业的下一个重大转变已经开始。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 7362字 | 30分钟 ]
【原文作者】 新智元
【摘要模型】 glm-4
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...