作者信息
【原文作者】 NLP前沿
【作者简介】 日更,近3天较实用的论文速读,这里的选文真的很干很前沿!!!
【微 信 号】 gh_ba5b38eb9e0f
文章摘要
Agent系统AnyTool旨在通过大规模API调用解决用户查询。其核心组成包括API检索器、求解器、自反思机制、评估协议以及实验与结果。
API检索器采用分层结构,包括元代理、类别代理和工具代理。元代理动态生成类别代理,类别代理对应Rapid API中的类别,工具代理负责搜索API并添加到候选池。
求解器利用生成的API候选池解决用户查询,可采用深度优先搜索决策树或链式思考方法,利用GPT-4的函数调用能力。
自反思机制在初始解决方案失败时重新激活系统,从API检索器到求解器,识别问题原因并重新激活代理,提供新提示和更新API候选池。
评估协议提出了AnyToolBench,手动审查查询以保留可通过特定API解决的查询,更贴近实际应用场景。
实验结果显示,AnyTool性能优于ToolLLM和GPT-4变体,平均通过率比ToolLLM提高35.4%。设计充分利用GPT-4的函数调用特性,有效利用超过16,000个API解决用户查询,避免了对外部模块的训练需求。
原文信息
【原文链接】 阅读原文
【原文字数】 607
【阅读时长】 3分钟
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...