神秘GPT模型引爆社区，GPT-4.5、GPT-5谣言满天飞，奥特曼在线围观

AIGC动态2年前 (2024)发布 almosthuman2014

2,922 0 0

文章摘要

在AI领域，GPT-5的发布备受期待，但OpenAI采取了迭代部署的策略，意味着他们可能会在GPT-5之前发布中间版本，如GPT-4.5。OpenAI的目标是避免给人带来跳跃式的技术进步感觉，而是希望通过更快的迭代来平滑技术发展。

最近，LMSYS Chatbot Arena上出现了一个名为“gpt2-chatbot”的神秘模型，引起了社交媒体上的广泛讨论。该模型自称是由OpenAI创建，基于GPT-4架构。许多测试者发现，gpt2-chatbot在某些任务上的表现不仅与GPT-4相当，甚至优于GPT-4 Turbo。这引发了人们的猜测，认为gpt2-chatbot可能是GPT-4的一个新版本，或者是GPT-5的测试版。

在一些具体的任务中，gpt2-chatbot显示出了其强大的能力。例如，在绘制TikZ独角兽的任务中，gpt2-chatbot的效果优于gpt-4-turbo。在数学问题解答方面，gpt2-chatbot能够一次性解答国际数学奥林匹克（IMO）的问题。此外，gpt2-chatbot在解决“A+B-1”问题时，表现优于所有其他模型。

在逻辑推理方面，gpt2-chatbot同样展现出了其优势。例如，在回答“我今天有3个苹果，昨天吃了一个。现在有几个苹果？”这类典型的逻辑推理题时，gpt2-chatbot不仅给出了准确的答案，还解释了原因，而其他大型模型如GPT-4、Claude-3 Opus、Gemini Ultra、Llama 3-70b则回答错误。在另一个逻辑题“Jessica有两个兄弟和一个姐妹。她的兄弟各有多少个姐妹？”中，gpt2-chatbot也给出了正确答案，而Claude-3 Opus则回答错误。

尽管gpt2-chatbot的真实身份尚未揭晓，但它在多个领域的出色表现已经引起了人们的极大兴趣，让人们对OpenAI未来的产品更新充满了期待。