标签:多样本越狱

OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!

Anthropic最新研究揭示了大型语言模型(LLM)的一个重大安全漏洞,称为多样本越狱(Many-shot jailbreaking,MSJ)。这种攻击方法利用了LLM的长上下文窗口,...