文章摘要
【关 键 词】 人工智能、技术竞争、模型排名、能力评测、国际焦点
零一万物公司提交的Yi-Large模型与OpenAI的GPT-4o并列中文分榜第一,同时在总榜上位列世界第七,成为中国大模型中的佼佼者。
Yi-Large模型的参数量达到千亿级别,其表现超越了Llama 3-70B、Claude 3 Sonnet等模型,使得零一万物成为全球总榜前十中唯一的中国大模型企业。
在去除冗余查询后的总榜中,Yi-Large的排名进一步提升,与Claude 3 Opus、GPT-4-0125-preview并列第四。
Yi-Large模型在编程能力、长提问和艰难提示词三个评测中均表现突出,分别位列全球第二,仅次於GPT-4o。这表明Yi-Large在处理高难度、专业性较强的任务时具有显著优势。
LMSYS Chatbot Arena已成为国际大厂如OpenAI、Anthropic、Google、Meta等在大型模型领域竞争的焦点,被视为后benchmark时代的风向标。
Yi-Large模型在其中的表现,不仅展示了中国大模型在国际竞争中的实力,也为中国大型模型技术的发展树立了新的里程碑。
原文和模型
【原文链接】 阅读原文 [ 2933字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 glm-4
【摘要评分】 ★★★★☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...