浙大发布Agent学习框架，13B 模型达到 ChatGPT 水平！

AI-Agent2年前 (2024)发布 admin

3,235 0 0

作者信息

【原文作者】 夕小瑶科技说
【作者简介】 更快的AI前沿，更深的行业洞见。聚集25万AI应用开发者、算法工程师和研究人员。一线作者均来自清北、国外顶级AI实验室和互联网大厂，兼备媒体sense与技术深度。
【微信号】 xixiaoyaoQAQ

文章摘要

【关键词】 AI Agent、大模型、自我分化、轨迹数据、多智能体

这篇文章介绍了2023年下半年AI Agent开启了“大模型下半场”，并提出了基于大模型的AI Agent的发展新思路。文章提到了浙江大学团队在2024年提出了AUTOACT框架，该框架通过自我分化生成能完成任务的子代理组，而不依赖大规模的标注数据和来自闭源模型合成的轨迹数据。AUTOACT框架主要包括Meta-Agent进行“Self-Instruct”对任务数据进行扩充，自动挑选工具并合成相关的轨迹数据，然后进行自我分化，构建“规划”，“工具”，“反思”三个子智能体使用数据集中的数据进行微调学习，最终在三个子智能体的“合作”下，解决相关任务。

实验结果显示，AUTOACT方法在Llama-2 13B和70B基础下训练出的Agent优于其他所有直接提示方法、CoT与Agent方法。在HotpotQA实现了3.77%的提升，在ScienceQA上实现了6.33%的提升。与基于闭源模型数据的微调模型FIREACT进行对比，AUTOACT在HotpotQA上提升了5.77%，在ScienceQA上提升了6.67%。此外，作者还对AUTOACT生成的轨迹数据进行了人工评估，结果显示其优于其他Agent方法。

最后，文章总结指出，AUTOACT框架将单一智能体的任务分解为三个子智能体分别优化，依赖精心设计的“分工模式”与“合作机制”，使得“三个臭皮匠，顶一个诸葛亮”。AUTOACT的方法也将为基于开源模型的自动Agent学习打好基础铺平道路，期待未来多智能体模式的基于开源模型的AI Agent可以不断百花齐放百家争鸣。