Redis鸟枪换炮了
文章摘要
【关 键 词】 Redis、多线程、查询引擎、性能提升、向量数据库
Redis,一款备受青睐的内存数据结构存储系统,最近宣布对其查询引擎进行重大改进,引入了多线程技术,以提高查询吞吐量并保持低延迟。这一进步对于处理数亿文档的数据量尤为重要,因为复杂查询可能会限制吞吐量。Redis声称,其响应时间保持在毫秒级以下,平均查询延迟在10毫秒以下。
Redis的新多线程方法解决了传统单线程架构在长时间运行查询时的局限性,这些查询会导致拥塞,降低整体吞吐量。搜索操作的复杂性在于它通常结合多个索引扫描以符合多个查询条件,这些扫描通常在对数时间复杂度内完成。新的架构允许多个查询在独立的线程上并发执行,从而提高整体系统吞吐量和可扩展性。
Redis进行了广泛的基准测试,以验证其查询引擎的性能,并与三个向量数据库提供商类别进行了比较:纯向量数据库、具备向量功能的通用数据库和完全托管的内存Redis云服务提供商(CSP)。Redis声称,其升级的查询引擎在速度和可扩展性上优于纯向量数据库,同时在整体性能上显著超过通用数据库和完全托管的内存Redis CSP。
向量数据库市场近年来显著增长,许多产品涌入市场,为新进入者和用户带来了挑战。行业专家指出,市场向量数据库选项已经饱和,新产品很难脱颖而出并找到独特的价值主张。Redis的新查询引擎声称查询吞吐量比上一代提高了16倍,满足了生成式AI应用的需求,如依赖实时RAG的聊天机器人,必须在检索向量数据库中的数据时快速处理多个步骤。
Gmail创始人Paul Buchheit提出了“100毫秒规则”,即每次交互应在100毫秒内完成,以给用户一种即时的感觉。RAG架构中延迟边界的细分显示:网络往返、LLM处理、生成式AI应用操作和向量数据库查询,导致平均端到端响应时间为1,513毫秒(1.5秒)。为应对这一挑战,开发者必须重新思考他们的数据架构,以构建接近100毫秒规则的实时生成式AI应用。
Redis基于gist-960-euclidean、glove-100-angular、deep-image-96-angular、dbpedia-openai-1M-angular数据集,具有不同的向量维度和距离函数进行基准测试,以确保测试的全面性。Redis已在Redis Software中立即提供了新的查询引擎,并计划在秋季发布Redis Cloud。
原文和模型
【原文链接】 阅读原文 [ 1760字 | 8分钟 ]
【原文作者】 AI大模型实验室
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆