标签:对抗攻击

揭秘多轮越狱攻击新框架:RACE 如何利用大模型推理能力突破安全防线?

来自北京航空航天大学等机构的研究团队提出RACE多轮越狱攻击框架,通过将有害查询转化为良性推理任务,成功突破多个主流大模型的安全防线。实验结果显示,该...