超越Devin！姚班带队，他们创大模型编程新世界纪录

AI-Agent1年前 (2024)发布 QbitAI

2,691 0 0

文章摘要

【关键词】 人工智能、编程评测、SWEBench、CodeGen Agent、开源理念

新入局的StarShip CodeGen Agent表现惊艳，以23.67%的成绩夺得全球第二的位置，这一成绩同时刷新了非GPT-4o基模的全球最高纪录。
SWEBench评测被认为高度贴近真实编程场景，难度极高。
OpenCSG的突破性成果得益于其对编程Agent的创新开发和大型模型算法的深度优化。
OpenCSG团队背景深厚，其CEO陈冉在开源软件领域享有盛誉，CTO王伟则来自清华姚班，具有丰富的人工智能研发经验。
OpenCSG坚持开源开放的理念，推出了CSGHub开源模型平台、wukong预训练模型、CSGCoder微调代码模型等，旨在让大模型赋能每个企业、每个人。
王伟强调，虽然SWEBench的测试成绩备受关注，但背后的产品价值才是他们更关心的。