
文章摘要
【关 键 词】 AI芯片、推理性能、个人计算机、开源软件、自动驾驶
在英伟达的GTC大会上,首席执行官黄仁勋展示了多项突破性技术和产品,涵盖了AI芯片、个人AI超级计算机、开源软件以及自动驾驶等领域。最引人注目的是新一代AI芯片GB300,其推理性能比前代GB200提升了1.5倍,并计划于2023年下半年出货。此外,黄仁勋还预览了下一代AI超级芯片Vera Rubin,预计2026年下半年发货,其整体性能将达到GB300的3.3倍。Vera Rubin的CPU和GPU分别命名为Vera和Rubin,其中Vera的内存和带宽分别是前代Grace的4.2倍和2.4倍,而Rubin将配备288GB的HBM4内存。更令人瞩目的是,2027年推出的Rubin Ultra性能将达到GB300的14倍。
在个人AI超级计算机方面,英伟达推出了两款新产品:DGX Spark和DGX Station。DGX Spark采用GB10芯片,提供每秒1000万亿次的AI运算,售价3000美元,大小与Mac Mini相当。DGX Station则搭载了最新的GB300芯片,拥有784GB的相干内存空间和高达800Gb/s的网络速度,预计将于2023年下半年上市。这两款产品主要面向研究人员、数据科学家和AI开发者。
在软件方面,英伟达开源了多个重要项目,其中最引人注目的是NVIDIA Dynamo,这是一个用于加速AI模型推理的分布式推理服务库。Dynamo能够动态调整GPU资源,优化数据卸载,从而显著降低推理成本并提高效率。此外,英伟达还开源了新的AI推理模型Llama Nemotron,该模型基于开源Llama基础模型构建,优化了计算效率和准确性。
在自动驾驶领域,英伟达与通用汽车达成合作,推出了端到端自动驾驶汽车全栈综合安全系统NVIDIA Halos。Halos系统涵盖了技术、开发和计算三个层面的安全防护措施,确保从云端到车辆的自动驾驶汽车的安全开发。此外,英伟达还与Google DeepMind和Disney Research合作开发了下一代开源仿真物理模型Newton,主要用于机器人模拟训练。同时,英伟达推出了全球首个开源的人形机器人基础模型Isaac GR00T N1,该模型能够泛化常见的任务并执行复杂的推理任务。
最后,GTC大会还首次设立了“量子日”活动,黄仁勋将与多家量子计算行业领军企业的高管讨论量子计算的技术现状和未来发展方向。这一活动引发了业界对量子计算未来发展的广泛关注。
原文和模型
【原文链接】 阅读原文 [ 2219字 | 9分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★