英伟达软硬件“双拳出击”:Blackwell Ultra、Rubin 芯片炸场,开源Dynamo让R1 token生成暴涨40倍

AIGC动态1天前发布 ai-front
134 0 0
英伟达软硬件“双拳出击”:Blackwell Ultra、Rubin 芯片炸场,开源Dynamo让R1 token生成暴涨40倍

 

文章摘要


【关 键 词】 人工智能芯片软件机器人计算

英伟达 GTC 2025 大会在加利福尼亚州圣何塞会议中心盛大开幕,吸引了全球科技界的广泛关注。作为人工智能计算机图形学领域的顶级峰会,GTC 大会被视为行业风向标,汇聚了来自世界各地的科技巨头、专家学者和开发者。英伟达首席执行官黄仁勋在开幕演讲中强调了计算和软件的重要性,指出世界正处于计算方式变革的过渡期,软件的未来需要大量资本投资。

黄仁勋首先讨论了人工智能的发展阶段,指出当前处于生成式人工智能阶段,未来将迈向代理式人工智能和物理人工智能时代。人工智能之所以变得更有用,是因为它“更聪明,可以推理”,并且其应用范围不断扩大。然而,训练和推理这些模型所需的计算量也大幅增加,黄仁勋表示,由于代理 AI 和推理的需求,目前所需的计算量是此前预期的 100 倍。他对数据中心业务充满信心,预计数据中心建设将达到 1 万亿美元。

在软件方面,黄仁勋强调英伟达是一家软件公司,并重点介绍了 CUDA 加速技术。CUDA 是 NVIDIA 于 2006 年推出的并行计算核心,现已构建了 900 多个特定领域的 CUDA-X 库和 AI 模型,广泛应用于天文学、粒子物理学、量子物理学等多个领域。黄仁勋表示,未来计算机会为软件生成代码片段,而不仅仅是文件的检索器

大会的另一亮点是发布了“AI 工厂的操作系统”Dynamo,这是一款开源推理软件,旨在以最低的成本和最高的效率加速和扩展 AI 推理模型。Dynamo 在 GB200 NVL72 机架的大型集群上运行 DeepSeek-R1 模型时,将每个 GPU 生成的 token 数量提高了 40 倍以上。Dynamo 通过动态调整 GPU 资源、优化推理性能,显著降低了推理成本,并支持多种 AI 推理框架。

英伟达还发布了 Blackwell Ultra 和 Vera Rubin 芯片。Blackwell Ultra 增强了训练和推理能力,预计将成为英伟达 AI 业务的主要支柱。Blackwell Ultra 的性能是 Hopper 的 40 倍,推理速度提高了 11 倍,计算能力提高了 7 倍。Vera Rubin 是下一代 GPU 系列,具有更高的计算速度和内存容量,Rubin 的性能可达 Hopper 的 900 倍,预计将于 2027 年下半年推出。

此外,英伟达开源了全球首个人形机器人基础模型 GROOT N1,这是世界上第一个完全可定制的通用人形推理和技能基础模型。黄仁勋表示,机器人的时代已经到来,世界劳动力短缺 5000 万人,机器人的需求与日俱增。GROOT N1 采用双系统架构,能够执行复杂任务,并支持开发人员使用真实或合成数据进行后期训练。

黄仁勋还宣布英伟达将与通用汽车在 AI 领域展开合作,并推出 NVIDIA Halos,这是一种综合安全系统,涵盖芯片、软件、工具和服务,旨在确保自动驾驶汽车的安全开发。黄仁勋宣称,自动驾驶汽车的时代已经到来

大会结束时,英伟达股价下跌 3%,通用汽车下跌 1.5%。尽管如此,英伟达在 AI 和计算领域的创新依然备受瞩目,未来将继续推动人工智能技术在各行业的广泛应用。

原文和模型


【原文链接】 阅读原文 [ 4625字 | 19分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3/community
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...