标签:后门行为

GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码

本研究深入探讨了大型语言模型(LLM)是否具备行为自我意识的能力,即模型能否准确描述自身的行为策略。研究结果表明,LLM确实展现出行为自我意识,能够识别...