国产大模型竞技场首超GPT-4o！零一万物GLM共同跻身Top10

AIGC动态1年前 (2024)发布 QbitAI

3,399 0 0

文章摘要

零一万物公司近日发布了其新旗舰模型Yi-Lightning（闪电），在大模型竞技场Chatbot Arena上取得了显著成绩，总榜单排名第六，数学分榜第三，代码等其他分榜也表现优异。这一成绩几乎与马斯克的xAI大模型Grok-2-08-13持平，超越了GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶尖模型。同时，智谱AI的GLM-4-Plus也进入总榜，排名第九。这些成绩是基于全球超过千万次的人类用户盲测投票得出的。

Yi-Lightning在中文能力上与GLM-4-Plus并列第二，数学能力与Gemini-1.5-Pro-002并列第三，代码能力排名第四。在Hard Prompts和Longer Query分榜上，Yi-Lightning也位列第四。大模型竞技场更新了规则，对AI回答的长度和风格等特征进行了降权处理，使得分数更能反映模型解决问题的能力。Yi-Lightning在这些调整后的排名变化不大，与GPT-4o、Grok-2保持在同一梯队。

零一万物创始人兼CEO李开复博士在发布会上展示了Yi-Lightning在不同场景下的能力，强调其推理速度快，生成质量高。与上半年的Yi-Large相比，Yi-Lightning的首包速度提升了一倍，推理速度提升了40%。在翻译文学作品时，Yi-Lightning不仅速度快，而且用词更精准，更具文学色彩。

Yi-Lightning采用了MoE混合专家模型架构，并在混合注意力机制、跨层注意力、动态Top-P路由机制等方面进行了优化，以降低推理成本并提高信息共享效率。此外，Yi-Lightning还采用了多阶段训练方法，前期注重数据多样性，后期侧重于更丰富、知识性更强的数据。团队还采用了不同的batch size和LR schedule以保证训练速度和稳定性。

李开复博士还强调了“模基共建”的重要性，即模型和基础架构的共同建设，以提高模型的性价比。Yi-Lightning的价格为每1M token 0.99元人民币，与OpenAI的o1-mini相比具有竞争力。此外，零一万物还首发了AI2.0数字人方案，该数字人已接入Yi-Lightning，提供了更自然、更强大的实时互动效果。李开复博士表示，尽管价格低廉，但公司并未亏损，并且Yi-Lightning的排名证明了国产大模型与硅谷顶尖模型的差距已缩小至五个月。