三个Agent顶个GPT-4，基于开源小模型的那种｜中大阿里联合出品

AI-Agent2年前 (2024)发布 QbitAI

3,299 0 0

作者信息

【原文作者】 量子位
【作者简介】 追踪人工智能新趋势，关注科技行业新突破
【微信号】 QbitAI

文章摘要

这篇文章介绍了一个名为α-UMi的多模型协作框架，通过三个小模型：planner、caller和summarizer的协作，实现了比肩GPT-4的工具调用效果。文章详细描述了α-UMi框架的工作原理和优势，以及在静态评估和真实API调用评估中的表现。通过多阶段微调GLPFT方法，α-UMi在多模型协作中取得了显著的性能提升，超越了其他基于闭源API框架的模型。研究人员还探讨了多模型协作框架的开销情况，指出虽然在训练和参数储存上会有一定开销，但在推理速度和性能上仍然具有优势。最后，文章展望了未来的研究方向，包括增强planner的泛化性和实现云端大模型与本地小模型的协同框架。

这篇文章的亮点在于介绍了一种基于开源小模型的多模型协作框架，展示了其在工具调用任务上的优越性能，并提出了GLPFT方法来优化多模型协作的训练效果。通过详细的实验评估和性能比较，文章充分展示了α-UMi框架的潜力和优势，为未来智能体发展提供了新思路。