GPT-4不服被Bard反超：最新模型已入场

AIGC动态2年前 (2024)发布 QbitAI

3,109 0 0

作者信息

【原文作者】 量子位
【作者简介】 追踪人工智能新趋势，关注科技行业新突破
【微信号】 QbitAI

文章摘要

1. 谷歌Bard在Chatbot Arena排行榜上超越了GPT-4，排名第二，仅次于GPT-4 Turbo。Bard的性能提升得益于搭载了新版大模型Gemini Pro-scale，具备了联网功能。
2. 网友对此表示不服和不公平，质疑混合在线和离线大模型在同一排行榜上会引起误解。
3. Imsys官方回应称，排行榜是实时的，投票数据公开透明，将发布关于用户提示多样性和投票质量的研究以及相应的数据集。
4. 对于网友关心的Bard超越的GPT-4是否为联网版本的问题，Imsys表示如果实时数据的接入能够提升用户体验，排行榜将予以体现，并表示愿意在竞技场中加入GPT-4联网版或Bing Copilot。
5. OpenAI的最新模型gpt-4-0125-preview已入驻竞技场，等待用户参与投票。
6. Chatbot Arena是由UC伯克利研究人员主导的Imsys组织创建的大模型权威榜单，采用匿名1V1battle的投票规则，基于Elo评级系统排名。
7. Bard超越GPT-4的两个版本冲到了第二名，和第一名的GPT-4 Turbo只差34分，但总票数相对较少。
8. 文章提供了详细的排行榜数据和评估方法，以及对Bard和GPT-4的票数对比。