Claude玩宝可梦，卡关就「装死」重启，大模型：逃避可耻但有用

AIGC动态6个月前发布 almosthuman2014

1,401 0 0

文章摘要

Anthropic最近发布了其最新的AI 模型Claude 3.7 Sonnet，该模型在推理能力上表现出色，甚至在某些情况下展现出令人惊讶的决策能力。为了展示其强大的推理能力，Anthropic让Claude在拓展模式下玩经典游戏《宝可梦・红》。通过配备知识库、视觉解析系统和模拟按键调用API，Claude在游戏中取得了显著进步，从最初连新手村都无法通过，到如今能够击败三个道馆的馆长，展现了其快速学习和适应能力。

在游戏过程中，Claude展现出了独特的决策逻辑。当它被困在游戏中的“月亮山”区域时，发现没有直接出口，Claude选择故意输掉一场战斗，以触发游戏中的“黑屏”机制，从而被传送回上一个宝可梦中心。这一决策虽然导致金钱损失，但Claude并不认为金钱有价值，而是更看重身体健康和游戏进展。这一行为引发了网友的广泛讨论，有人认为Claude已经掌握了“重启”的精髓，甚至将其比作“无限流”的主角。

Claude的行为也引发了对AI模型“过度思考”问题的讨论。研究者指出，类似于Claude的模型在简单问题上往往会耗费过多的计算资源，导致效率低下。例如，在回答“2加3等于几”这样的简单问题时，Claude类模型可能会产生多达13种解决方案，消耗的token数量远超传统模型。这种现象不仅降低了模型的效率，还可能导致其在复杂任务中的表现不佳。

为了解决这一问题，研究者提出了两个未来探索方向：一是开发自适应调控策略，让模型能够根据问题的复杂程度动态调整推理深度；二是设计更精细的效率评估指标，以更全面地评估模型的思考效率。这些方向或许能为Claude在游戏中的反常行为提供解决思路。

总的来说，Claude 3.7 Sonnet的表现在一定程度上展示了AI模型在复杂任务中的潜力，但也暴露了其在简单任务上的效率问题。未来的研究需要进一步优化模型的推理策略，以提高其在不同场景下的表现。