模型信息
【模型公司】 OpenAI
【模型名称】 gpt-3.5-turbo-0125
【摘要评分】 ★★☆☆☆
文章摘要
【关 键 词】 AI模型、开源、性能、数据增量训练、代码数学
在这篇文章中,介绍了李开复旗下AI公司零一万物发布的新AI模型Yi-9B,该模型拥有90亿参数,被称为Yi系列中的“理科状元”。
与其他类似规模的开源模型相比,Yi-9B表现最佳,并且对开发者友好,可以在消费级显卡上部署。
Yi-9B是在之前发布的Yi-6B和Yi-34B系列的基础上进行深度扩增和多阶段增量训练而成的。
通过增加模型大小和优化调参方法,Yi-9B实现了88亿参数,达到4k上下文长度。
在代码和数学能力方面,Yi-9B表现出色,在各项测试中都取得了优异的成绩。
除此之外,Yi-9B在常识推理能力和语言能力方面也表现出色,受到了广泛好评。
整体而言,Yi-9B在尺寸相近的开源模型中表现最佳,展现出强大的综合能力。
如果你对这款新模型感兴趣,可以通过传送门查看更多详细信息。
原文信息
【原文链接】 阅读原文
【阅读预估】 1265 / 6分钟
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...