阿里云 AI 搜索 RAG 大模型优化实践

2,032 0 0

文章摘要

在AICon全球人工智能开发与应用大会上，阿里云高级算法专家欧明栋分享了阿里云如何利用大模型优化RAG（检索增强生成）的实践经验。RAG在知识问答领域有显著优势，但面临文档解析结构丢失、大模型生成幻觉等问题。阿里云通过文档结构化、大模型微调和Agent技术等手段提升RAG效果和性能。

阿里云选择RAG的原因是其使用原始知识，减少幻觉问题，实时更新信息，提供生成答案的依据，降低成本。RAG架构包括文档解析、切片处理、查询改写、搜索和大模型生成答案等步骤。但RAG在处理复杂场景或文档时，存在幻觉、拒答、回答不完整等问题。为提升效果，需关注文档解析准确性、切片语义完整性、信息召回完整性和大模型总结推理准确率。

在大模型优化方面，阿里云进行文档层级结构抽取，提高切片效率，帮助大模型理解文档内容。对模型进行微调，选择较小模型保证处理速度，效果与大参数量模型相当。采用Agent技术拆解复杂问题，提高回答质量。RAG系统由数据层、离线服务、在线引擎、搜索组件和组件编排等模块组成，支持多种数据格式和源，提供向量化文本切片和数据提取，支持自研和第三方大模型，采用多种策略处理不同问题。

在文档结构化方面，阿里云开发语义层级抽取模型，利用大模型语义理解能力抽取文档层级结构，提高切片完整性，用于内容摘要。采用结构化方法处理文档，生成摘要，提供全面答案。探索结合长文本处理和切片的方法，提高效率和准确性。

在大模型微调和Agent探索方面，阿里云关注幻觉问题，通过微调模型提高回答质量。建立RAG回答评估链路，基于检索结果、问题和回答评估效果。通过大模型自身评估，迭代优化，提高准确率。在千问1.5上进行实验，微调的14B模型表现接近72B模型，幻觉率显著降低。

阿里云在RAG场景中处理复杂问题，如多步推理和多篇文档信息聚合。尝试接入规划Agent，评估搜索结果，执行搜索和总结。探索更简单的方法，先执行直接搜索，再决定是否进一步搜索，提高效率和效果。

RAG应用场景包括电商、内容、企业知识库和教育搜题等。基于AI搜索开发平台构建，包括内容解析、切分、向量表示等模块。以营养咨询为例，系统检索相关切片，进行总结和推理，生成新问题搜索，再次总结，生成完整回答。