标签:AI竞技

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

国产AI模型DeepSeek V3在竞技场排名中表现出色,总体排名优于o1-mini,位列第七,并被认证为最强开源模型,也是唯一进入前十的开源模型。在困难提示、编程、...

字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代要结束了

在字节跳动的AI应用开发平台“扣子”上,出现了一种新颖的模型竞技方式——“模型广场”。这个概念类似于国外权威的大模型擂台“Chatbot Arena”,用户可以参与其中,...