作者信息
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破
【微 信 号】 QbitAI
文章摘要
【关 键 词】 Chatbot、Bard、GPT-4、Turbo、排行榜
1. 谷歌Bard在Chatbot Arena排行榜上超越了GPT-4,排名第二,仅次于GPT-4 Turbo。Bard的性能提升得益于搭载了新版大模型Gemini Pro-scale,具备了联网功能。
2. 网友对此表示不服和不公平,质疑混合在线和离线大模型在同一排行榜上会引起误解。
3. Imsys官方回应称,排行榜是实时的,投票数据公开透明,将发布关于用户提示多样性和投票质量的研究以及相应的数据集。
4. 对于网友关心的Bard超越的GPT-4是否为联网版本的问题,Imsys表示如果实时数据的接入能够提升用户体验,排行榜将予以体现,并表示愿意在竞技场中加入GPT-4联网版或Bing Copilot。
5. OpenAI的最新模型gpt-4-0125-preview已入驻竞技场,等待用户参与投票。
6. Chatbot Arena是由UC伯克利研究人员主导的Imsys组织创建的大模型权威榜单,采用匿名1V1battle的投票规则,基于Elo评级系统排名。
7. Bard超越GPT-4的两个版本冲到了第二名,和第一名的GPT-4 Turbo只差34分,但总票数相对较少。
8. 文章提供了详细的排行榜数据和评估方法,以及对Bard和GPT-4的票数对比。
原文信息
【原文链接】 阅读原文
【原文字数】 793
【阅读时长】 3分钟
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...