国产大模型首次超过 GPT-4o！零一万物「闪电」只用 2000 张 GPU 追平马斯克 Grok

AIGC动态1年前 (2024)发布 aitechtalk

3,149 0 0

国产大模型首次超过 GPT-4o！零一万物「闪电」只用 2000 张 GPU 追平马斯克 Grok

文章摘要

【关键词】 预训练模型、Yi-Lightning、超越GPT、成本控制、AI普惠

零一万物公司近期发布了其最新的预训练旗舰模型Yi-Lightning，该模型在国际权威盲测榜单LMSYS上超越了OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet，排名世界第六，中国第一，标志着中国大模型首次在全球大模型竞技场上超越了OpenAI的GPT-4。Yi-Lightning在保持高性能的同时，推理速度大幅提升，首包时间较之前的Yi-Large减少一半，最高生成速度提升近四成。此外，Yi-Lightning在成本控制上也取得了显著成效，每百万token的推理成本仅需0.99元，接近行业最低价，为开发者和企业客户提供了极高的性价比。

Yi-Lightning的成功得益于零一万物在人才储备和知识积累上的扎实基础，以及其“模基共建”战略，即模型、基础设施和应用的三体合一。在训练Yi-Lightning时，零一万物采用了混合注意力机制、动态Top-P路由和多阶段训练等先进技术，有效提升了模型的计算效率和推理速度。此外，Yi-Lightning在LMSYS的多个分榜上均取得了优异成绩，展现了其在多轮对话、数学能力和代码能力等方面的全球第一梯队实力。

零一万物的Yi-Lightning模型已上线其大模型开放平台，为开发者和企业客户提供了易于接入和使用的SOTA大模型服务。公司还公布了基于Yi-Lightning的AI 2.0数字人产品，聚焦零售和电商场景，通过实际应用展示了Yi-Lightning在提升业务效果方面的潜力。

在大模型行业进入“长跑阶段”的背景下，零一万物的Yi-Lightning模型不仅在技术上取得了突破，也为中国大模型行业的发展提供了新的方向和动力。公司将继续坚持“模型＋AI Infra＋应用”的全栈式布局，推动大模型能力在更多应用层的落地，迎接AI普惠时代的到来。