文章摘要
【关 键 词】 Claude 3 Opus、GPT-4、Chatbot Arena、聊天机器人、ChatGPT
最近,Chatbot Arena的聊天机器人对战排行榜更新,Claude 3 Opus成功超越了GPT-4,成为新的领导者。
这个排行榜的权威性在于,每个模型的得分完全取决于真实人类用户的使用体验。用户会同时向两个匿名模型提出相同的问题,然后根据回答投票给表现更好的模型。如果一次回答不能确定,用户可以继续聊天,直到确定获胜者。如果在对话中透露了模型的身份,则不会计算投票。
Claude 3家族的整体表现都非常亮眼,其中Claude 3 Sonnet排到了第4,而最小的Claude 3 HaiKu也达到了GPT-4水平。Claude 3 Haiku不仅与原始版本的GPT-4表现一样好,关键是相当便宜,在一些平台你甚至可以免费使用。
然而,ChatGPT的情况并不乐观。最近一段时间,ChatGPT一直被指责懒惰、系统提示臃肿,而另一方面竞争也愈演愈烈。Claude 3和Gemini Pro 1.5现在都提供了比GPT-4多8倍的上下文长度和更好的recall能力。对于几乎每个ChatGPT用例,现在都有大量垂直化的AI初创公司,致力于满足用户的需求,而不是满足于现有的ChatGPT界面和捆绑工具。
OpenAI的B2B和B2C部分相互竞争,这在某种程度上是良性竞争。OpenAI可以使用来自ChatGPT的RLHF数据进行训练。而新的GPT商店可以看作是,OpenAI为了抓住这些垂直化需求的尝试。大部分创作者也很明智,一般只向ChatGPT发布精简版的应用,作为自己主要平台的一个渠道。
总的来说,Claude 3 Opus的成功超越GPT-4,标志着聊天机器人领域的新变化。而ChatGPT的未来发展,可能会以平台专属模型为特色,以此来抓住垂直化需求的机会。
原文和模型
【原文链接】 阅读原文 [ 1266字 | 6分钟 ]
【原文作者】 新智元
【摘要模型】 gpt-4-32k
【摘要评分】 ★★★★★