英伟达软硬件“双拳出击”：Blackwell Ultra、Rubin 芯片炸场，开源Dynamo让R1 token生成暴涨40倍

1,355 0 0

文章摘要

英伟达 GTC 2025 大会在加利福尼亚州圣何塞会议中心盛大开幕，吸引了全球科技界的广泛关注。作为人工智能和计算机图形学领域的顶级峰会，GTC 大会被视为行业风向标，汇聚了来自世界各地的科技巨头、专家学者和开发者。英伟达首席执行官黄仁勋在开幕演讲中强调了计算和软件的重要性，指出世界正处于计算方式变革的过渡期，软件的未来需要大量资本投资。

黄仁勋首先讨论了人工智能的发展阶段，指出当前处于生成式人工智能阶段，未来将迈向代理式人工智能和物理人工智能时代。人工智能之所以变得更有用，是因为它“更聪明，可以推理”，并且其应用范围不断扩大。然而，训练和推理这些模型所需的计算量也大幅增加，黄仁勋表示，由于代理 AI 和推理的需求，目前所需的计算量是此前预期的 100 倍。他对数据中心业务充满信心，预计数据中心建设将达到 1 万亿美元。

在软件方面，黄仁勋强调英伟达是一家软件公司，并重点介绍了 CUDA 加速技术。CUDA 是 NVIDIA 于 2006 年推出的并行计算核心，现已构建了 900 多个特定领域的 CUDA-X 库和 AI 模型，广泛应用于天文学、粒子物理学、量子物理学等多个领域。黄仁勋表示，未来计算机会为软件生成代码片段，而不仅仅是文件的检索器。

大会的另一亮点是发布了“AI 工厂的操作系统”Dynamo，这是一款开源推理软件，旨在以最低的成本和最高的效率加速和扩展 AI 推理模型。Dynamo 在 GB200 NVL72 机架的大型集群上运行 DeepSeek-R1 模型时，将每个 GPU 生成的 token 数量提高了 40 倍以上。Dynamo 通过动态调整 GPU 资源、优化推理性能，显著降低了推理成本，并支持多种 AI 推理框架。

英伟达还发布了 Blackwell Ultra 和 Vera Rubin 芯片。Blackwell Ultra 增强了训练和推理能力，预计将成为英伟达 AI 业务的主要支柱。Blackwell Ultra 的性能是 Hopper 的 40 倍，推理速度提高了 11 倍，计算能力提高了 7 倍。Vera Rubin 是下一代 GPU 系列，具有更高的计算速度和内存容量，Rubin 的性能可达 Hopper 的 900 倍，预计将于 2027 年下半年推出。

此外，英伟达开源了全球首个人形机器人基础模型 GROOT N1，这是世界上第一个完全可定制的通用人形推理和技能基础模型。黄仁勋表示，机器人的时代已经到来，世界劳动力短缺 5000 万人，机器人的需求与日俱增。GROOT N1 采用双系统架构，能够执行复杂任务，并支持开发人员使用真实或合成数据进行后期训练。

黄仁勋还宣布英伟达将与通用汽车在 AI 领域展开合作，并推出 NVIDIA Halos，这是一种综合安全系统，涵盖芯片、软件、工具和服务，旨在确保自动驾驶汽车的安全开发。黄仁勋宣称，自动驾驶汽车的时代已经到来。

大会结束时，英伟达股价下跌 3%，通用汽车下跌 1.5%。尽管如此，英伟达在 AI 和计算领域的创新依然备受瞩目，未来将继续推动人工智能技术在各行业的广泛应用。