开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star

AI-Agent10个月前发布 almosthuman2014
1,556 0 0
开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star

 

文章摘要


【关 键 词】 AI程序员开源项目SWE-agent智能体接口自动化编程

机器之心最近报道了一个引人注目的开源项目SWE-agent,这是一个由普林斯顿大学NLP组研究人员开发的AI程序员。SWE-agent在不到24小时内就获得了超过1400个GitHub Star,显示出其受欢迎程度。这个系统能够自主解决GitHub存储库中的问题,并且在SWE-bench测试集上展现了与Devin相似的准确度,平均耗时93秒。

SWE-agent的工作原理是将大型模型(如GPT-4)转变为软件工程智能体,能够修复真实GitHub存储库中的错误和问题。它实现了SOTA性能,在SWE-bench测试集上解决了12.29%的问题。SWE-agent通过与专用终端交互来提供开发过程中的自动化,具备打开、搜索文件内容、使用自动语法检查、编辑特定行以及编写并执行测试的能力。项目开发者还精心设计了用户界面,并在GitHub上进行了介绍。

研究团队为SWE-agent设计了智能体 – 计算机接口(ACI),这是一种以大模型为中心的命令和反馈格式,使得大模型能够更方便地浏览存储库、查看、编辑和执行代码文件。他们还构建了SWE智能体存储库,以便轻松迭代存储库级编码智能体的ACI设计。研究表明,良好的ACI设计可以显著提高智能体的性能。

SWE-agent的几个关键功能包括:添加一个在发出编辑命令时运行的linter,以确保代码语法正确;为智能体提供一个专门构建的文件查看器,最佳效果是每轮仅显示100行;提供专门构建的全目录字符串搜索命令,简洁地列出匹配项;以及当命令的输出为空时,返回一条消息提示命令已成功运行但未产生任何输出。未来发布的论文将详细介绍这些功能。

使用SWE-agent需要一些设置,包括安装DockerMiniconda,创建和激活swe-agent环境,创建swe-agent docker镜像,以及在存储库的根目录下创建一个keys.cfg文件并填写必要的API密钥。SWE-agent的工作流程包括两个步骤:接收输入的GitHub问题并返回尝试修复它的拉取请求,以及评估拉取请求以验证它确实解决了问题。用户可以在整个SWE-bench上运行和评估SWE-agent,或者使用特定的过滤器运行SWE-bench中的单个问题。

SWE-agent的开源发布为AI在软件开发领域的应用提供了新的可能性,它不仅展示了AI在编程任务中的潜力,也为担心AI代替工作的人们提供了一个实际的工具来探索和适应这一变化。随着相关论文的即将发布,我们可以期待更多关于SWE-agent的详细信息和进一步的发展。

原文和模型


【原文链接】 阅读原文 [ 1127字 | 5分钟 ]
【原文作者】 机器之心
【摘要模型】 gpt-4
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...