Hugging Face发布AI代码生成工具StarCoder 2,支持600多种编程语言
模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★
文章摘要
【关 键 词】 AI、代码生成器、StarCoder 2、开源、性能
摘要:
开发者们正迅速采用AI驱动的代码生成器,如GitHub Copilot和Amazon CodeWhisperer,以及Meta的Code Llama。然而,这些工具存在局限性,如成本和许可证限制。为了满足市场需求,AI初创公司Hugging Face与ServiceNow合作开发了StarCoder,一个开源代码生成器,其许可证限制较小。StarCoder 2是该系列的最新版本,包括三个不同规模的模型,旨在提高编码效率,同时降低运行成本。尽管StarCoder 2在性能上有所提升,但它也面临着安全性、许可证限制和偏见问题。Hugging Face、ServiceNow和Nvidia声称,StarCoder 2在伦理性和法律风险方面优于竞争对手。此外,StarCoder 2的开源特性允许在本地部署,对于担心隐私和安全的开发者和公司具有吸引力。
详细摘要:
开发者们正以惊人的速度开始采用AI驱动的代码生成器,例如GitHub Copilot和Amazon CodeWhisperer这样的服务,以及像Meta的Code Llama这样的开放访问模型。这些工具虽然提高了编码效率,但并非完美,存在成本和许可证限制等问题。
为了应对这些挑战,AI初创公司Hugging Face与工作流自动化平台ServiceNow合作,开发了StarCoder,一个开源代码生成器。StarCoder 2是该系列的最新版本,包括三个不同规模的模型,旨在提高编码效率,同时降低运行成本。这些模型在训练数据量上增加了4倍,提供了显著改善的性能。
StarCoder 2的模型系列包括ServiceNow训练的30亿参数模型、Hugging Face训练的70亿参数模型和Nvidia训练的150亿参数模型。这些模型能够在大多数现代消费级GPU上运行,并且可以在短短几小时内针对特定数据进行精准调整,以创建应用程序。
尽管StarCoder 2在性能上有所提升,但它也面临着安全性、许可证限制和偏见问题。斯坦福的研究发现,使用代码生成系统的工程师更容易在应用程序中引入安全漏洞。此外,StarCoder 2采用的BigCode Open RAIL-M 1.0许可证虽然限制较少,但并非完全开放,可能会与某些法规发生冲突。
Hugging Face、ServiceNow和Nvidia声称,StarCoder 2在伦理性方面更胜一筹,且面临的法律风险较小。与使用版权代码训练的代码生成器不同,StarCoder 2仅使用了来自Software Heritage的许可数据进行训练,提供了更高的透明度和可审计性。
尽管StarCoder 2在性能和伦理性方面有所优势,但它仍然不完美。它可能生成反映性别和种族刻板印象的代码元素,并且在非英语语言和资源较少的代码上表现较差。然而,Hugging Face的机器学习工程师Leandro von Werra认为,StarCoder 2展示了完全开放的模型如何能够提供有竞争力的性能。
最后,Hugging Face、ServiceNow和Nvidia通过StarCoder 2项目投资于培养良好的商业声誉,并在开源发布的基础上构建付费服务。StarCoder 2的模型、源代码等都可以从项目的GitHub页面下载,为开发者提供了无成本的离线体验。
原文信息
【原文链接】 阅读原文
【阅读预估】 2230 / 9分钟
【原文作者】 AI大模型实验室
【作者简介】 关注大模型技术的创新与发展,探索大模型的实际应用,探讨 AI 未来对企业与社会发展的影响。