文章摘要
【关 键 词】 英伟达、AI Enterprise 5.0、微服务、AI模型、应用落地
英伟达近期发布了AI Enterprise 5.0,这是一款包含英伟达微服务和可下载的软件容器的产品,用于部署生成式AI应用程序和加速计算。该产品已经被Uber等知名客户采用,并且可以从领先的云服务提供商、系统构建商和软件供应商处获得。
开发人员正在转向微服务,将其作为在全球范围内构建现代企业应用程序的有效方式。他们通过浏览器工作,使用云API或应用程序编程接口来编写可在系统上运行并为全球用户提供服务的应用程序。NVIDIA AI Enterprise 5.0现在包含广泛的微服务,用于在生产中部署AI模型的NVIDIA NIM以及包括NVIDIA CUOpt的NVIDIA CUDA-X微服务集合。
NIM微服务优化了来自NVIDIA及其合作伙伴生态系统的数十种流行AI模型的推理。NIM由NVIDIA推理软件(包括Triton Inference Server、TensorRT和TensorRT-LLM)提供支持,将部署时间从几周缩短到几分钟。它提供基于行业标准的安全性和可管理性以及与企业级管理工具的兼容性。
NVIDIA cuOpt是一种GPU加速的AI微服务,创造了路线优化的世界记录,并可以支持动态决策,从而降低成本、时间和碳足迹。它是帮助各行业将人工智能投入生产的CUDA-X微服务之一。
英伟达还在开发更多功能,例如,NVIDIA RAG LLM操作员(现在处于早期访问阶段)将把副驾驶和其他使用检索增强生成的生成式AI应用程序从试点转移到实际应用落地,而无需重写任何代码。
总的来说,英伟达的AI Enterprise 5.0无论通过何种方式访问,都能帮助用户从安全、可投入生产且性能优化的软件中受益,并可以灵活地部署在数据中心、云端、工作站或网络边缘的应用程序。这是英伟达在AI领域的又一重要步骤,有助于推动AI的广泛应用和发展。
原文和模型
【原文链接】 阅读原文 [ 583字 | 3分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 gpt-4-32k
【摘要评分】 ★★★★★