标签:CodeGen Agent

超越Devin!姚班带队,他们创大模型编程新世界纪录

新入局的StarShip CodeGen Agent表现惊艳,以23.67%的成绩夺得全球第二的位置,这一成绩同时刷新了非GPT-4o基模的全球最高纪录。SWEBench评测被认为高度贴近...