一款小而强大的编程助手：零一万物正式开源Yi-Coder系列模型

AIGC动态1年前 (2024)发布 ai-front

2,245 0 0

文章摘要

【关键词】 Yi-Coder模型、编程任务、性能强大、多语言支持、开源成果

零一万物公司近期开源了Yi-Coder系列模型，这是继Yi-1.5系列模型之后的又一开源成果。Yi-Coder系列专为编程任务设计，提供1.5B和9B两种参数规模的模型。其中，Yi-Coder-9B在性能上超越了其他10B参数以下的模型，甚至能与33B参数的DeepSeek-Coder相媲美。

Yi-Coder模型的特点包括小参数量但性能强大，能够处理长达128K tokens的长序列，有效捕捉长期依赖关系，适用于复杂代码的理解和生成。此外，Yi-Coder支持52种主要编程语言，在代码生成和跨文件代码补全方面表现出色。

在LiveCodeBench基准测试中，Yi-Coder-9B-Chat的通过率达到23.4%，在10B以下参数量的模型中排名第一，超过了DeepSeek-Coder-33B-Instruct、CodeGeex4-All-9B、CodeLLama-34B-Instruct和CodeQwen1.5-7B-Chat等模型。在Zero-shot HumanEval、3-shot MBPP和CRUXEval-O等基准测试中，Yi-Coder同样展现了优异的性能，尤其在CRUXEval-O中的准确率首次达到50%以上。

在代码编辑和补全能力方面，Yi-Coder-9B-Chat在CodeEditorBench的Primary和Plus子集中均优于其他模型。在跨文件代码补全的CrossCodeEval基准测试中，Yi-Coder在有检索和无检索的情况下均优于同等规模的模型。

Yi-Coder在长序列建模方面也表现优秀，成功完成了128K长序列的“Needle in the code”评估任务。在数学推理能力方面，Yi-Coder在七个数学题数据集上的准确率达到70.3%，超过了DeepSeek-Coder 33B的65.8%。

对于希望尝试Yi-Coder的用户，可以通过阅读原文获取Yi-Coder的README，了解具体的下载和使用步骤。此外，AICon全球人工智能开发与应用大会·上海站成功举办，提供了大模型训练与推理机制、多模态融合等热点内容的深入剖析。QCon会议则涵盖了AI应用开发、大模型基础设施与算力优化等多个方面，现在报名可享受9折优惠。