标签:轨迹数据

浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!

实验结果显示,AUTOACT方法在Llama-2 13B和70B基础下训练出的Agent优于其他所有直接提示方法、CoT与Agent方法。在HotpotQA实现了3.77%的提升,在ScienceQA上...