消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强

AIGC动态8个月前发布 QbitAI
934 0 0

模型信息


【模型公司】 OpenAI
【模型名称】 gpt-3.5-turbo-0125
【摘要评分】 ★★☆☆☆

消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强
 

文章摘要


【关 键 词】 AI模型开源性能数据增量训练代码数学

在这篇文章中,介绍了李开复旗下AI公司零一万物发布的新AI模型Yi-9B,该模型拥有90亿参数,被称为Yi系列中的“理科状元”。

与其他类似规模的开源模型相比,Yi-9B表现最佳,并且对开发者友好,可以在消费级显卡上部署。

Yi-9B是在之前发布的Yi-6B和Yi-34B系列的基础上进行深度扩增和多阶段增量训练而成的。

通过增加模型大小和优化调参方法,Yi-9B实现了88亿参数,达到4k上下文长度。

在代码和数学能力方面,Yi-9B表现出色,在各项测试中都取得了优异的成绩。

除此之外,Yi-9B在常识推理能力和语言能力方面也表现出色,受到了广泛好评。

整体而言,Yi-9B在尺寸相近的开源模型中表现最佳,展现出强大的综合能力。

如果你对这款新模型感兴趣,可以通过传送门查看更多详细信息。

原文信息


【原文链接】 阅读原文
【阅读预估】 1265 / 6分钟
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破

© 版权声明

相关文章

暂无评论

暂无评论...