标签:攻击方法

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

近期,Anthropic公司的研究人员发现,随着大型语言模型上下文窗口长度的增加,模型的安全性问题再次凸显,即所谓的“越狱”现象。这一现象意味着模型可能会生成...