Claude也变懒了!网友:学会给自己放假了

Claude也变懒了!网友:学会给自己放假了

 

文章摘要


【关 键 词】 AI性能欧洲暑假系统提示模拟行为性能研究

Reddit用户近期注意到AI大模型Claude的表现似乎有所下降,抱怨其反应变慢,输出内容减少。对此,Claude的首席信息安全官Jason Clinton回应称,模型存储在静态文件中,运行在多个服务器上,没有进行任何更改,因此表现不应有变化。他还提到,尽管有用户反馈,但点踩数并未增加,API客户也没有类似反馈。

独立AI研究员@nearcyan提出了一种解释,认为Claude可能在模拟欧洲的暑假习惯。他指出,Claude在7月12日发布了新的系统提示词,这些提示词作为其背景知识,可能影响了其行为。由于8月是欧洲人度假的高峰期,Claude可能在模拟这种工作模式。此外,Claude的训练数据包含了不同国家的工作习惯,它有能力模拟这些习惯。后期训练可能使Claude更倾向于欧洲风格,而模拟框架则允许它根据特定情境模拟行为

@nearcyan还提到,Claude的名字在系统提示中出现了52次,这可能强化了其与这个名字的关联,而Claude这个名字在法国很常见,法国以其夏季假期而闻名。因此,Claude可能在模拟法国知识工作者的行为。

尽管有网友提出方法试图让Claude摆脱“懒惰”,但目前还没有确凿数据支持所谓的“寒暑假假说”。去年,GPT-4也出现了类似情况,OpenAI承认GPT-4变得越来越“懒”,但未找出具体原因。网友@Rob Lynch的测试显示,GPT-4在12月的输出比5月少了约200个字符,但其他尝试复现这一测试的人并未发现明显关联。

目前,关于大型模型性能下降的真正原因,学术界仍在深入研究中。同时,蚂蚁集团、中国计算机学会数据库专委和机器之心将联合主办一场论坛,探讨图计算的前沿技术发展及其在AI时代的应用价值与挑战。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 2166字 | 9分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明

相关文章

暂无评论

暂无评论...