标签:透明

OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击

随着大型推理模型(LRMs)的快速发展,其推理能力和安全性之间的平衡成为关键问题。近期研究表明,模型的安全审查透明化反而成为其弱点,攻击者可以通过「思...