文章摘要
【关 键 词】 搜索增强、推理模型、知识检索、Agentic框架、性能卓越
中国人民大学和清华大学联合推出了名为Search-o1的最新Agentic搜索增强推理模型框架,该框架在博士级别的科学问答、数学和代码能力的11项评测中表现出色,赢得了10个第一。该框架的核心优势在于其能够识别推理过程中的知识不足,并主动搜索补充所需知识,然后继续推理,类似于人类的思考过程。
Search-o1通过结合RAG(Retrieval-Augmented Generation)和Reason-in-Documents模块来增强框架,自主检索外部知识,提升大型推理模型的可靠性和适用性。Reason-in-Documents模块独立于主推理链,负责分析文档生成中间推理序列,并生成精炼知识以整合到推理链中。Agentic RAG机制则允许模型在推理过程中自主决定何时检索外部知识,以解决不确定性问题。
在广泛的测试中,Search-o1在科学、数学和编码等复杂推理任务以及六个开放领域QA基准测试中表现优异。在11个测试集中,Search-o1在10个任务上优于原生推理和传统RAG方法。此外,Search-o1在整体性能、物理学和生物学方面甚至优于人类专家,尽管在化学领域稍逊于化学家。
该项目已开源,可通过GitHub和Hugging Face获取。Search-o1框架使用的基础模型QwQ-32B-Preview也是开源的。项目通讯作者是人大高瓴人工智能学院的教授窦志成,其余作者包括Xiaoxi Li、Guanting Dong、Jiajie Jin、Yuyao Zhang、Yujia Zhou、Yutao Zhu和Peitian Zhang,其中Yujia Zhou来自清华大学。
原文和模型
【原文链接】 阅读原文 [ 2121字 | 9分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆