国产黑马与GPT-4o称霸中文榜首!Yi-Large勇夺国内LLM盲测桂冠,冲进世界第七

AIGC动态6个月前发布 AIera
1,063 0 0
国产黑马与GPT-4o称霸中文榜首!Yi-Large勇夺国内LLM盲测桂冠,冲进世界第七

 

文章摘要


【关 键 词】 人工智能技术竞争模型排名能力评测国际焦点

零一万物公司提交的Yi-Large模型与OpenAI的GPT-4o并列中文分榜第一,同时在总榜上位列世界第七,成为中国大模型中的佼佼者。

Yi-Large模型的参数量达到千亿级别,其表现超越了Llama 3-70B、Claude 3 Sonnet等模型,使得零一万物成为全球总榜前十中唯一的中国大模型企业。

在去除冗余查询后的总榜中,Yi-Large的排名进一步提升,与Claude 3 Opus、GPT-4-0125-preview并列第四。

Yi-Large模型在编程能力、长提问和艰难提示词三个评测中均表现突出,分别位列全球第二,仅次於GPT-4o。这表明Yi-Large在处理高难度、专业性较强的任务时具有显著优势。

LMSYS Chatbot Arena已成为国际大厂如OpenAI、Anthropic、Google、Meta等在大型模型领域竞争的焦点,被视为后benchmark时代的风向标。

Yi-Large模型在其中的表现,不仅展示了中国大模型在国际竞争中的实力,也为中国大型模型技术的发展树立了新的里程碑。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 2933字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

© 版权声明

相关文章

暂无评论

暂无评论...