2024年大模型的发力点：大模型Agent，分享6篇最新LLM Agent研究成果

AI-Agent1年前 (2024)发布 admin

4,610 0 0

2024年大模型的发力点：大模型Agent，分享6篇最新LLM Agent研究成果

文章摘要

随着人工智能的快速发展，大模型（Large Language Models，LLMs）已经成为研究和应用的热点。Google最近的研究指出，尽管大模型在生成任务中表现出色，但它们并不能模拟人类的规划思维，因为人类在规划时会在脑中进行详细的想象和策划，而大模型仅仅是预测下一个Token。亚利桑那州立大学的研究也表明，大模型自身无法进行规划推理，它们只是将问题从一种语法格式转换成另一种符号表示，真正的问题解决还需要外部符号求解器的帮助。

微软研究人员探讨了Agent AI的基础，强调了智能Agent在多个领域的能力，如物理、虚拟现实、感官交互等，并指出Agent AI可能是下一代人工智能的关键。因此，随着大模型应用场景的复杂化，依赖大模型的能力将面临挑战，构建大模型Agent成为大势所趋。

文章接着介绍了六篇关于大模型Agent的研究成果：

1. DS-Agent：由吉大、上交等提出，旨在让大语言模型智能体扮演数据科学家的角色，处理机器学习建模任务。技术上采用基于案例的推理（CBR），使Agent能够利用过去的经验解决新问题。

2. LLM-Modulo：提出了一个新框架，结合大型语言模型和外部验证工具，使LLMs在规划任务中发挥重要作用。

3. SceneCraft：一个创新的Agent，能将文本描述转换成Python脚本，在Blender中创建3D场景。它通过高级抽象和战略规划解决空间规划的复杂性，并具备自我改进的能力。

4. GitAgent：旨在让大型语言模型通过GitHub自动寻找合适的代码库，提高处理复杂任务的能力。实验表明，GitAgent在处理用户问题上有69.4%的成功率。

5. LearnAct：针对LLM Agent在试错学习方面的局限性，提出了一个迭代学习策略，通过创建和改进Python函数形式的动作进行开放式动作学习。

6. RepoAgent：一个基于大型语言模型的开源框架，用于自动生成、维护和更新代码文档，展示了在创建高质量代码仓库文档方面的能力。

最后，文章提到了AINLPer的星球，这是一个自然语言处理AI知识分享平台，提供最新的研究成果、行业动态、学习资料和实战项目，对于从事相关研究和科研的人士是一个有价值的资源。