开源版AI程序员来了：GPT-4加持，能力比肩Devin，一天1.4k Star

AI-Agent1年前 (2024)发布 almosthuman2014

3,207 0 0

开源版AI程序员来了：GPT-4加持，能力比肩Devin，一天1.4k Star

文章摘要

【关键词】 AI程序员、开源项目、SWE-agent、智能体接口、自动化编程

机器之心最近报道了一个引人注目的开源项目：SWE-agent，这是一个由普林斯顿大学NLP组研究人员开发的AI程序员。SWE-agent在不到24小时内就获得了超过1400个GitHub Star，显示出其受欢迎程度。这个系统能够自主解决GitHub存储库中的问题，并且在SWE-bench测试集上展现了与Devin相似的准确度，平均耗时93秒。

SWE-agent的工作原理是将大型模型（如GPT-4）转变为软件工程智能体，能够修复真实GitHub存储库中的错误和问题。它实现了SOTA性能，在SWE-bench测试集上解决了12.29%的问题。SWE-agent通过与专用终端交互来提供开发过程中的自动化，具备打开、搜索文件内容、使用自动语法检查、编辑特定行以及编写并执行测试的能力。项目开发者还精心设计了用户界面，并在GitHub上进行了介绍。

研究团队为SWE-agent设计了智能体 – 计算机接口（ACI），这是一种以大模型为中心的命令和反馈格式，使得大模型能够更方便地浏览存储库、查看、编辑和执行代码文件。他们还构建了SWE智能体存储库，以便轻松迭代存储库级编码智能体的ACI设计。研究表明，良好的ACI设计可以显著提高智能体的性能。

SWE-agent的几个关键功能包括：添加一个在发出编辑命令时运行的linter，以确保代码语法正确；为智能体提供一个专门构建的文件查看器，最佳效果是每轮仅显示100行；提供专门构建的全目录字符串搜索命令，简洁地列出匹配项；以及当命令的输出为空时，返回一条消息提示命令已成功运行但未产生任何输出。未来发布的论文将详细介绍这些功能。

使用SWE-agent需要一些设置，包括安装Docker、Miniconda，创建和激活swe-agent环境，创建swe-agent docker镜像，以及在存储库的根目录下创建一个keys.cfg文件并填写必要的API密钥。SWE-agent的工作流程包括两个步骤：接收输入的GitHub问题并返回尝试修复它的拉取请求，以及评估拉取请求以验证它确实解决了问题。用户可以在整个SWE-bench上运行和评估SWE-agent，或者使用特定的过滤器运行SWE-bench中的单个问题。

SWE-agent的开源发布为AI在软件开发领域的应用提供了新的可能性，它不仅展示了AI在编程任务中的潜力，也为担心AI代替工作的人们提供了一个实际的工具来探索和适应这一变化。随着相关论文的即将发布，我们可以期待更多关于SWE-agent的详细信息和进一步的发展。