国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

AIGC动态4小时前发布 QbitAI
26 0 0
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

 

文章摘要


【关 键 词】 AI模型性能提升技术创新市场竞争价格优势

零一万物公司近日发布了其新旗舰模型Yi-Lightning(闪电),在大模型竞技场Chatbot Arena上取得了显著成绩,总榜单排名第六,数学分榜第三,代码等其他分榜也表现优异。这一成绩几乎与马斯克的xAI大模型Grok-2-08-13持平,超越了GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶尖模型。同时,智谱AI的GLM-4-Plus也进入总榜,排名第九。这些成绩是基于全球超过千万次的人类用户盲测投票得出的。

Yi-Lightning在中文能力上与GLM-4-Plus并列第二,数学能力与Gemini-1.5-Pro-002并列第三,代码能力排名第四。在Hard Prompts和Longer Query分榜上,Yi-Lightning也位列第四。大模型竞技场更新了规则,对AI回答的长度和风格等特征进行了降权处理,使得分数更能反映模型解决问题的能力。Yi-Lightning在这些调整后的排名变化不大,与GPT-4o、Grok-2保持在同一梯队。

零一万物创始人兼CEO李开复博士在发布会上展示了Yi-Lightning在不同场景下的能力,强调其推理速度快,生成质量高。与上半年的Yi-Large相比,Yi-Lightning的首包速度提升了一倍,推理速度提升了40%。在翻译文学作品时,Yi-Lightning不仅速度快,而且用词更精准,更具文学色彩。

Yi-Lightning采用了MoE混合专家模型架构,并在混合注意力机制、跨层注意力、动态Top-P路由机制等方面进行了优化,以降低推理成本并提高信息共享效率。此外,Yi-Lightning还采用了多阶段训练方法,前期注重数据多样性,后期侧重于更丰富、知识性更强的数据。团队还采用了不同的batch size和LR schedule以保证训练速度和稳定性。

李开复博士还强调了“模基共建”的重要性,即模型和基础架构的共同建设,以提高模型的性价比。Yi-Lightning的价格为每1M token 0.99元人民币,与OpenAI的o1-mini相比具有竞争力。此外,零一万物还首发了AI2.0数字人方案,该数字人已接入Yi-Lightning,提供了更自然、更强大的实时互动效果。李开复博士表示,尽管价格低廉,但公司并未亏损,并且Yi-Lightning的排名证明了国产大模型与硅谷顶尖模型的差距已缩小至五个月。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 1589字 | 7分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明

相关文章

暂无评论

暂无评论...