文章摘要
【关 键 词】 向量数据库、GPU加速、AI应用、性能提升、Milvus 2.4
<新智元报道了在GTC 2024大会上,Zilliz与<英伟达>共同发布了全球首个GPU加速向量数据库。这款革命性的向量数据库系统首次采用了<英伟达GPU>的高效并行处理能力和中的,实现了基于GPU的向量索引和搜索加速能力。与基于CPU处理器的索引技术相比,GPU加速的Milvus在向量搜索性能上提升了50倍。目前,Milvus 2.4的<开源版本>已经发布,而Milvus商业版全托管云服务计划在年底前推出GPU加速功能。Zilliz已成为全球首家提供海内外多云服务的向量数据库企业,覆盖了全球五大云服务的13个节点。
是一款为大规模向量相似度搜索和AI应用开发的开源向量数据库系统,自2019年开源以来,已在AI开发者社区中广受欢迎。Milvus已被5000多家企业采用,服务于多个行业。在数据驱动时代,快速准确检索大量非结构化数据对于支持前沿AI应用至关重要。实时索引和高吞吐量是向量数据库的核心需求,GPU的并行处理能力使其成为加速向量数据库运算的理想选择。
<英伟达>开发的利用GPU的高性能能力为向量数据库工作负载提供高吞吐量。Milvus采用模块化设计理念,便于集成GPU加速。Milvus 2.4架构包括协调器、访问层、消息队列、工作节点和存储层等组件,CAGRA集成于索引节点和查询节点中,显著提升了索引构建和查询处理速度。
性能评估使用了AWS上的三种实例类型,通过VectorDBBench的两个公开向量数据集评估Milvus 2.4的性能和可扩展性。结果显示,GPU加速框架CAGRA在索引构建和查询处理方面明显优于基于CPU的HNSW。GPU加速将索引构建时间缩短了一个数量级,显著提升了查询吞吐量,尤其适用于要求极致性能的关键场景。
总之,Milvus 2.4的发布开启了向量数据库领域的新纪元,GPU加速技术的应用将为AI应用和大数据处理带来革命性的变革。
“`
原文和模型
【原文链接】 阅读原文 [ 2162字 | 9分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★