文章摘要
【关 键 词】 CodeFuse、研发效能、技术创新、数据安全、技术普惠
蚂蚁集团技术专家肖斌在即将举行的QCon上海大会上分享了CodeFuse代码大模型在推动公司研发效能提升方面的经验和见解。CodeFuse作为蚂蚁集团大模型研发提效的核心力量,通过提高代码编写速度、降低重复工作和编码门槛等方面,重塑了技术人员的工作方式。肖斌强调,CodeFuse的创新技术突破包括多语言代码底座大模型、自适应语法粒度的代码块生成技术、跨文件跨仓库的上下文代码理解和补全,以及强化学习持续提升模型效果。
CodeFuse的特别之处在于其与蚂蚁集团数据训练和业务能力的紧密结合,以及自研代码助手的数据安全性。在IDE插件方面,代码补全功能被认为是最佳,因为它在编码过程中持续辅助研发工作。在构建CodeFuse IDE系列插件的过程中,团队面临了性能挑战,通过模型量化、多卡并行等技术提升推理速度,并与业务方合作提高AI能力。
肖斌还讨论了Copilot模式和Copilot+Agent模式的技术实现差异,以及CodeFuse如何通过上下文感知学习解决模型幻觉问题。CodeFuse在蚂蚁集团研发全生命周期中通过IDE插件和openAPI接口集成,提升研发效能。肖斌表示,CodeFuse利用内部知识库增强性能,通过程序分析、质量模型筛选高质量代码数据,并结合安全能力进行数据清洗。
对于CodeFuse未来的期待,肖斌希望将其覆盖到非研发人员,实现技术普惠,并在开源社区做出贡献。他认为,CodeFuse为行业带来了重要的启示和贡献,尤其是在大模型快速发展的过程中。
原文和模型
【原文链接】 阅读原文 [ 2844字 | 12分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆