浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!

AI-Agent5个月前发布 admin
764 0 0

作者信息


【原文作者】 夕小瑶科技说
【作者简介】 更快的AI前沿,更深的行业洞见。聚集25万AI应用开发者、算法工程师和研究人员。一线作者均来自清北、国外顶级AI实验室和互联网大厂,兼备媒体sense与技术深度。
【微 信 号】 xixiaoyaoQAQ

浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!
 

文章摘要


【关 键 词】 AI Agent大模型自我分化轨迹数据多智能体

这篇文章介绍了2023年下半年AI Agent开启了大模型下半场”,并提出了基于大模型的AI Agent的发展新思路。文章提到了浙江大学团队在2024年提出了AUTOACT框架,该框架通过自我分化生成能完成任务的子代理组,而不依赖大规模的标注数据和来自闭源模型合成的轨迹数据。AUTOACT框架主要包括Meta-Agent进行“Self-Instruct”对任务数据进行扩充,自动挑选工具并合成相关的轨迹数据,然后进行自我分化,构建“规划”,“工具”,“反思”三个子智能体使用数据集中的数据进行微调学习,最终在三个子智能体的“合作”下,解决相关任务。

实验结果显示,AUTOACT方法在Llama-2 13B70B基础下训练出的Agent优于其他所有直接提示方法、CoT与Agent方法。在HotpotQA实现了3.77%的提升,在ScienceQA上实现了6.33%的提升。与基于闭源模型数据的微调模型FIREACT进行对比,AUTOACT在HotpotQA上提升了5.77%,在ScienceQA上提升了6.67%。此外,作者还对AUTOACT生成的轨迹数据进行了人工评估,结果显示其优于其他Agent方法。

最后,文章总结指出,AUTOACT框架将单一智能体的任务分解为三个子智能体分别优化,依赖精心设计的“分工模式”“合作机制”,使得“三个臭皮匠,顶一个诸葛亮”AUTOACT的方法也将为基于开源模型的自动Agent学习打好基础铺平道路,期待未来多智能体模式的基于开源模型的AI Agent可以不断百花齐放百家争鸣。

原文信息


【原文链接】 阅读原文
【原文字数】 2181
【阅读时长】 8分钟

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...