文章摘要
【关 键 词】 人工智能、编程评测、SWEBench、CodeGen Agent、开源理念
新入局的StarShip CodeGen Agent表现惊艳,以23.67%的成绩夺得全球第二的位置,这一成绩同时刷新了非GPT-4o基模的全球最高纪录。
SWEBench评测被认为高度贴近真实编程场景,难度极高。
OpenCSG的突破性成果得益于其对编程Agent的创新开发和大型模型算法的深度优化。
OpenCSG团队背景深厚,其CEO陈冉在开源软件领域享有盛誉,CTO王伟则来自清华姚班,具有丰富的人工智能研发经验。
OpenCSG坚持开源开放的理念,推出了CSGHub开源模型平台、wukong预训练模型、CSGCoder微调代码模型等,旨在让大模型赋能每个企业、每个人。
王伟强调,虽然SWEBench的测试成绩备受关注,但背后的产品价值才是他们更关心的。
原文和模型
【原文链接】 阅读原文 [ 2168字 | 9分钟 ]
【原文作者】 量子位
【摘要模型】 glm-4
【摘要评分】 ★★★★★
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...