英特尔开源RAG Foundry 框架,可增强多种RAG用例

AIGC动态1天前发布 AIGCOPEN
58 0 0
英特尔开源RAG Foundry 框架,可增强多种RAG用例

 

文章摘要


【关 键 词】 RAG框架模块化设计数据创建模型训练性能评估

英特尔实验室研究人员开源了RAG Foundry,这是一个专为大模型RAG框架开发和增强的工具,具有高度灵活性和扩展性。RAG Foundry支持多种RAG用例,包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。开发人员可以通过RAG Foundry选择不同的检索算法和工具,实现一站式RAG开发。

RAG Foundry采用模块化设计,由数据创建、训练、推理和性能评测四部分组成。数据创建与处理模块是核心,包括数据集加载、列规范化、数据聚合、信息检索、基于模板的提示创建及预处理等,确保数据质量和一致性,为训练和推理提供上下文信息。支持从Hugging Face hub或本地源加载数据集,并通过选择器进行数据过滤、清洗和子集选择,确保数据集多样性和代表性。检索器集成外部数据库、工具、库和流程信息,为模型提供更大知识库。

训练模块使用数据创建模块生成的数据集微调模型,帮助其学习如何利用检索信息生成准确答案。训练配置允许指定模型和训练参数,包括学习率、优化器、批量大小、训练周期等,并支持使用LoRA技术增强模型适应性。训练模块还支持使用指令文件,指导模型训练过程。

推理模块在训练好的模型基础上,对新输入数据进行推理,生成预测结果。推理过程中考虑模型计算资源需求,支持批量推理,提高处理速度。

评估模块用于评估RAG技术和调优,加载推理模块生成的预测结果,并使用一系列指标评估模型性能。在问答任务中,可以使用精确匹配(EM)、F1分数等评估指标,评估模型回答的准确性。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1039字 | 5分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...