神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜

AIGC动态2个月前发布 QbitAI
253 0 0
神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜

 

文章摘要


【关 键 词】 神秘大模型问题解决中文能力稳定性

一款名为“gpt2-chatbot”的神秘模型突然成为了大模型领域的焦点,其能力超越了包括GPT-4在内的多个开源模型。这款模型在解决问题和推理方面表现出色,例如能够一次性正确回答国际数学奥林匹克竞赛的题目,生成旋转的3D立方体,并且在逻辑陷阱问题上能够给出合理的回答。

gpt2-chatbot的中文能力也很强,能够理解并准确回答中文问题,显示出它可能不是基于Llama 3微调的模型。它能够提供详细的知识信息,如地理距离、世界纪录和商品价格等。在测试中,gpt2-chatbot透露自己是由OpenAI训练的,基于GPT-4架构,并且具备接受图像输入的能力。

目前,唯一已知的测试gpt2-chatbot的方式是通过LMSYS大模型竞技场的Direct Chat功能,但每人每天的消息数量和全局的消息限制都非常有限。在测试中,gpt2-chatbot的回答在不同时间和地点都是一致的,这表明它是一个稳定的模型。

关于gpt2-chatbot的身份,有多种猜测。一些人认为它可能是匿名发布的GPT-4.5或GPT-4的原始版本,经过不同的对齐训练。另一种猜测是,它可能是LMSYS组织基于2019年的GPT-2架构训练的模型,这一猜测的依据是一篇论文声称GPT-2在某些情况下的能力超过了多个现代模型,而该论文的一位作者与LMSYS的赞助商MBZUAI(阿联酋人工智能大学)有关联。尽管存在这些猜测,gpt2-chatbot的真实身份仍然是一个谜。

原文和模型


【原文链接】 阅读原文 [ 2310字 | 10分钟 ]
【原文作者】 量子位
【摘要模型】 gpt-4
【摘要评分】 ★★★☆☆

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...