标签：攻击方法

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

近期，Anthropic公司的研究人员发现，随着大型语言模型上下文窗口长度的增加，模型的安全性问题再次凸显，即所谓的“越狱”现象。这一现象意味着模型可能会生成...

AIGC动态

1年前 (2024)