颠覆传统RAG,创新大模型检索增强—Insight-RAG

AIGC动态15小时前发布 AIGCOPEN
76 0 0
颠覆传统RAG,创新大模型检索增强—Insight-RAG

 

文章摘要


【关 键 词】 RAG信息检索深度学习框架语言模型

Megagon实验室的研究人员提出了一种创新框架Insight-RAG,旨在解决传统RAG方法在检索深度和多源信息整合方面的不足。传统RAG方法依赖表面相关性检索文档,容易忽略文档中深埋的细微信息,如法律协议中的微妙条款或商业报告中的隐藏数据趋势。Insight-RAG框架通过三个核心模块——洞察力识别器、洞察力挖掘器和响应生成器,显著提升了信息检索和回答生成的准确性。

洞察力识别器是Insight-RAG框架的第一步,负责从输入查询中提取关键的信息需求。通过分析查询和任务背景,该模块识别出完成任务所需的核心信息,并将其转化为一个可以被后续模块理解的“洞察力”。例如,对于问题“Person X的出生地是哪里?”,洞察力识别器会提取出“Person X was born in”这样的句子片段。这种格式不仅简化了问题的表达,还为后续模块提供了明确的检索方向。此外,洞察力识别器还能判断问题的答案是否为多个,如“加利福尼亚有哪些城市?”这样的问题,答案应为多个城市。

洞察力挖掘器是Insight-RAG框架的第二步,其任务是根据洞察力识别器提取的句子片段,从文档数据库中检索出与之高度相关的具体内容。这一模块的核心是一个经过专门训练的大型语言模型,研究人员使用LLaMA-3.2 3B模型作为洞察力挖掘器,并对其进行了持续预训练。预训练过程中,模型不仅学习了原始文档的内容,还学习了从文档中提取的三元组信息。这种双重训练方式使得模型能够更好地理解文档中的语义关系,并能够根据输入的句子片段检索出与之高度相关的具体内容。

响应生成器是Insight-RAG框架的最后一步,负责将原始查询与洞察力挖掘器检索到的具体内容结合起来,生成一个上下文丰富且准确的回答。这一模块的核心是一个经过微调的大型语言模型,通过整合原始查询和检索到的见解,生成一个完整的回答。例如,如果原始问题是“Person X的出生地是哪里?”,洞察力识别器提取出的句子片段是“Person X was born in”,而洞察力挖掘器检索到的具体内容是“New York”,那么响应生成器将生成一个完整的回答:“Person X的出生地是纽约。”这种设计使得Insight-RAG框架能够生成高质量的回答,不仅考虑了文档中的表面相关性,还深入挖掘了文档中的语义信息。

为了评估Insight-RAG框架的性能,研究人员使用了AAN和OC两个科学论文数据集进行了综合测试。结果显示,Insight-RAG框架在深层信息检索任务中表现出色。与传统的RAG方法相比,Insight-RAG在大多数情况下都能显著提高准确率。例如,在AAN数据集中,Insight-RAG的准确率比传统RAG方法提高了约60%。Insight-RAG框架在多源信息聚合任务中同样表现非常好。与传统的RAG方法相比,Insight-RAG能够更有效地聚合来自多个来源的信息,从而提高模型的性能。例如,在OC数据集中,Insight-RAG的准确率比传统RAG方法提高了约50%。这些结果表明,Insight-RAG框架在处理复杂任务时表现得更加出色,能够更好地捕捉任务特定的细微信息,并生成更高质量的响应。

原文和模型


【原文链接】 阅读原文 [ 1130字 | 5分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek-v3
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...