“Chatbot Arena”的搜索结果

Arena-Hard:开源高质量大模型评估基准
该文章介绍了一个专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的平...
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
零一万物公司近日发布了其新旗舰模型Yi-Lightning(闪电),在大模型竞技场Chatbot Arena上取得了显著成绩,总榜单排名第六,数学分榜第...
GPT 未竟的革命,由 o1 接棒:或是 LLM 研究最重要的发现
OpenAI近期推出了o1系列,标志着其在人工智能领域的又一次重大突破。o1系列在处理复杂推理任务方面表现出色,其在国际数学奥林匹克(IMO...
马斯克的「xAI」计划
Elon Musk's newly-founded AI company, xAI, has made significant strides in the field of artificial intelligence with the releas...
人人都爱Anthropic
OpenAI联合创始人John Schulman在为公司工作近9年后,选择离开并加入竞争对手Anthropic,他解释这一决定是为了更专注于AI对齐研究,并重...
新王登基,Gemini 1.5 Pro 再度更新,超越 GPT 4o 和 Claude-3.5
DeepMind研发的Gemini 1.5 Pro实验版(0801)在Chatbot Arena排名中取得了显著成绩,超越了GPT-4o和Claude-3.5,夺得了第一名。这一成绩...
谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o
谷歌近期推出了一款名为Gemini 1.5 Pro (0801)的人工智能模型,该模型在Google AI Studio和Gemini API上供用户免费测试和反馈。在一项测...
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快
谷歌近期在人工智能领域取得了显著进展,特别是在开发高效且安全的AI模型方面。该公司开源了Gemma 2模型系列,包括9B和27B版本,并在对...
字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代要结束了
在字节跳动的AI应用开发平台“扣子”上,出现了一种新颖的模型竞技方式——“模型广场”。这个概念类似于国外权威的大模型擂台“Chatbot Arena”...
刺激!扣子模型广场上线,实时 PK 高下立见
扣子模型广场的推出为用户在选择国内主流大语言模型时提供了一种全新的评估方式。该平台借鉴了国际开放研究组织LMSYS Org的大模型竞技场...
1 2 3