CodeFuse：蚂蚁集团如何用AI革新代码开发，提升研发效能的深度解析

AI-Agent1年前 (2024)发布 ai-front

3,320 0 0

文章摘要

蚂蚁集团技术专家肖斌在即将举行的QCon上海大会上分享了CodeFuse代码大模型在推动公司研发效能提升方面的经验和见解。CodeFuse作为蚂蚁集团大模型研发提效的核心力量，通过提高代码编写速度、降低重复工作和编码门槛等方面，重塑了技术人员的工作方式。肖斌强调，CodeFuse的创新技术突破包括多语言代码底座大模型、自适应语法粒度的代码块生成技术、跨文件跨仓库的上下文代码理解和补全，以及强化学习持续提升模型效果。

CodeFuse的特别之处在于其与蚂蚁集团数据训练和业务能力的紧密结合，以及自研代码助手的数据安全性。在IDE插件方面，代码补全功能被认为是最佳，因为它在编码过程中持续辅助研发工作。在构建CodeFuse IDE系列插件的过程中，团队面临了性能挑战，通过模型量化、多卡并行等技术提升推理速度，并与业务方合作提高AI能力。

肖斌还讨论了Copilot模式和Copilot+Agent模式的技术实现差异，以及CodeFuse如何通过上下文感知学习解决模型幻觉问题。CodeFuse在蚂蚁集团研发全生命周期中通过IDE插件和openAPI接口集成，提升研发效能。肖斌表示，CodeFuse利用内部知识库增强性能，通过程序分析、质量模型筛选高质量代码数据，并结合安全能力进行数据清洗。

对于CodeFuse未来的期待，肖斌希望将其覆盖到非研发人员，实现技术普惠，并在开源社区做出贡献。他认为，CodeFuse为行业带来了重要的启示和贡献，尤其是在大模型快速发展的过程中。