模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★
文章摘要
【关 键 词】 AI软件、Devin、自动化、Cognition AI、行业进步
摘要:
– 首个AI软件工程师Devin由Cognition AI公司推出,能够独立处理整个软件开发项目。
– 在SWE-bench基准测试中,Devin无需人类帮助,能解决13.86%的问题,远超GPT-4的1.74%。
– Devin具备端到端构建和部署程序、自主查找并修复bug、训练和微调AI模型、修复开源库、贡献成熟代码库以及现学现卖不熟悉技术的能力。
– Devin背后的Cognition AI公司虽为初创,但团队成员拥有10枚IOI金牌,且已获得2100万美元A轮融资。
– 业内人士认为,自动化软件工程将经历人机共驾阶段,最终实现完全自动化,Devin的出现被视为行业的重要进步。
详情:
1. Devin的介绍:Devin被描述为世界首个完全自主的AI软件工程师,专注于长程推理和规划,能够执行复杂软件工程任务。它能够使用常用开发工具,并能根据指令完成整个工作流程。
2. Devin的能力:Devin能够构建和部署程序、查找并修复bug、训练和微调AI模型、修复开源库、贡献成熟生产库,并且能够学习新技术并迅速应用。
3. 基准测试结果:在更具挑战性的SWE-bench测试中,Devin取得了13.86%的解决率,而GPT-4在无辅助条件下的问题解决率为零。
4. Cognition AI公司:背后的公司Cognition AI是一家位于纽约和旧金山的初创公司,团队成员拥有丰富的AI前沿工作经验和10枚IOI金牌,已获得Founders Fund基金的2100万美元A轮融资。
5. 行业观点:前特斯拉AI总监卡帕西将Devin的出现与自动化驾驶的发展进程相比较,认为自动化软件工程将逐步发展,最终实现完全自动化。
原文信息
【原文链接】 阅读原文
【阅读预估】 2950 / 12分钟
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破