国产大模型首次超过 GPT-4o!零一万物「闪电」只用 2000 张 GPU 追平马斯克 Grok

国产大模型首次超过 GPT-4o!零一万物「闪电」只用 2000 张 GPU 追平马斯克 Grok

 

文章摘要


【关 键 词】 预训练模型Yi-Lightning超越GPT成本控制AI普惠

零一万物公司近期发布了其最新的预训练旗舰模型Yi-Lightning,该模型在国际权威盲测榜单LMSYS上超越了OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet,排名世界第六,中国第一,标志着中国大模型首次在全球大模型竞技场上超越了OpenAI的GPT-4。Yi-Lightning在保持高性能的同时,推理速度大幅提升,首包时间较之前的Yi-Large减少一半,最高生成速度提升近四成。此外,Yi-Lightning在成本控制上也取得了显著成效,每百万token的推理成本仅需0.99元,接近行业最低价,为开发者和企业客户提供了极高的性价比。

Yi-Lightning的成功得益于零一万物在人才储备和知识积累上的扎实基础,以及其“模基共建”战略,即模型、基础设施和应用的三体合一。在训练Yi-Lightning时,零一万物采用了混合注意力机制、动态Top-P路由和多阶段训练等先进技术,有效提升了模型的计算效率和推理速度。此外,Yi-Lightning在LMSYS的多个分榜上均取得了优异成绩,展现了其在多轮对话、数学能力和代码能力等方面的全球第一梯队实力。

零一万物的Yi-Lightning模型已上线其大模型开放平台,为开发者和企业客户提供了易于接入和使用的SOTA大模型服务。公司还公布了基于Yi-Lightning的AI 2.0数字人产品,聚焦零售和电商场景,通过实际应用展示了Yi-Lightning在提升业务效果方面的潜力。

在大模型行业进入“长跑阶段”的背景下,零一万物的Yi-Lightning模型不仅在技术上取得了突破,也为中国大模型行业的发展提供了新的方向和动力。公司将继续坚持“模型+AI Infra+应用”的全栈式布局,推动大模型能力在更多应用层的落地,迎接AI普惠时代的到来。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 4120字 | 17分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明

相关文章

暂无评论

暂无评论...