标签:DevBench

GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了

DevBench团队最近推出了首个AI软件工程师Devin,它的能力在技术界引起了广泛关注。Devin不仅能够解决编码任务,还能独立完成软件开发的整个周期,包括项目规...