英特尔开源RAG Foundry 框架，可增强多种RAG用例

1,299 0 0

文章摘要

英特尔实验室研究人员开源了RAG Foundry，这是一个专为大模型RAG框架开发和增强的工具，具有高度灵活性和扩展性。RAG Foundry支持多种RAG用例，包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。开发人员可以通过RAG Foundry选择不同的检索算法和工具，实现一站式RAG开发。

RAG Foundry采用模块化设计，由数据创建、训练、推理和性能评测四部分组成。数据创建与处理模块是核心，包括数据集加载、列规范化、数据聚合、信息检索、基于模板的提示创建及预处理等，确保数据质量和一致性，为训练和推理提供上下文信息。支持从Hugging Face hub或本地源加载数据集，并通过选择器进行数据过滤、清洗和子集选择，确保数据集多样性和代表性。检索器集成外部数据库、工具、库和流程信息，为模型提供更大知识库。

训练模块使用数据创建模块生成的数据集微调模型，帮助其学习如何利用检索信息生成准确答案。训练配置允许指定模型和训练参数，包括学习率、优化器、批量大小、训练周期等，并支持使用LoRA技术增强模型适应性。训练模块还支持使用指令文件，指导模型训练过程。

推理模块在训练好的模型基础上，对新输入数据进行推理，生成预测结果。推理过程中考虑模型计算资源需求，支持批量推理，提高处理速度。

评估模块用于评估RAG技术和调优，加载推理模块生成的预测结果，并使用一系列指标评估模型性能。在问答任务中，可以使用精确匹配（EM）、F1分数等评估指标，评估模型回答的准确性。