阿里云 AI 搜索 RAG 大模型优化实践

AI-Agent3个月前发布 ai-front
809 0 0
阿里云 AI 搜索 RAG 大模型优化实践

 

文章摘要


【关 键 词】 人工智能大模型RAG技术文档结构化Agent技术

在AICon全球人工智能开发与应用大会上,阿里云高级算法专家欧明栋分享了阿里云如何利用大模型优化RAG(检索增强生成)的实践经验。RAG在知识问答领域有显著优势,但面临文档解析结构丢失、大模型生成幻觉等问题。阿里云通过文档结构化、大模型微调和Agent技术等手段提升RAG效果和性能。

阿里云选择RAG的原因是其使用原始知识,减少幻觉问题,实时更新信息,提供生成答案的依据,降低成本。RAG架构包括文档解析、切片处理、查询改写、搜索和大模型生成答案等步骤。但RAG在处理复杂场景或文档时,存在幻觉、拒答、回答不完整等问题。为提升效果,需关注文档解析准确性、切片语义完整性、信息召回完整性和大模型总结推理准确率。

在大模型优化方面,阿里云进行文档层级结构抽取,提高切片效率,帮助大模型理解文档内容。对模型进行微调,选择较小模型保证处理速度,效果与大参数量模型相当。采用Agent技术拆解复杂问题,提高回答质量。RAG系统由数据层、离线服务、在线引擎、搜索组件和组件编排等模块组成,支持多种数据格式和源,提供向量化文本切片和数据提取,支持自研和第三方大模型,采用多种策略处理不同问题。

在文档结构化方面,阿里云开发语义层级抽取模型,利用大模型语义理解能力抽取文档层级结构,提高切片完整性,用于内容摘要。采用结构化方法处理文档,生成摘要,提供全面答案。探索结合长文本处理和切片的方法,提高效率和准确性。

在大模型微调和Agent探索方面,阿里云关注幻觉问题,通过微调模型提高回答质量。建立RAG回答评估链路,基于检索结果、问题和回答评估效果。通过大模型自身评估,迭代优化,提高准确率。在千问1.5上进行实验,微调的14B模型表现接近72B模型,幻觉率显著降低。

阿里云在RAG场景中处理复杂问题,如多步推理和多篇文档信息聚合。尝试接入规划Agent,评估搜索结果,执行搜索和总结。探索更简单的方法,先执行直接搜索,再决定是否进一步搜索,提高效率和效果。

RAG应用场景包括电商、内容、企业知识库和教育搜题等。基于AI搜索开发平台构建,包括内容解析、切分、向量表示等模块。以营养咨询为例,系统检索相关切片,进行总结和推理,生成新问题搜索,再次总结,生成完整回答。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 6649字 | 27分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...