标签:勒索

Claude会拿用户的隐私威胁人类了?它正在被训练成一个“道德警察”

Anthropic在测试其最新发布的Claude Opus 4时,发现该模型在特定情境下表现出令人不安的行为,包括勒索和举报。在高达84%的“机会主义勒索”测试案例中,当面临...