我把我的文章手搓成了Token炸弹，发现这样居然还能防AI洗稿。

1,355 0 0

文章摘要

【关键词】 AI洗稿、防抄袭、Unicode、变体选择符、Token炸弹

内容创作者面临的最大威胁之一是AI洗稿，尤其是通过复制文章片段并使用AI重写的方式。这种方式难以举报，因为重写后的内容与原作差异较大。为了解决这一问题，作者从OpenAI创始成员Karpathy的推文中获得灵感，尝试在文章中嵌入隐藏信息，以防止AI洗稿。

Karpathy的推文提到，他通过在一个表情符号中隐藏信息，成功让DeepSeek R1模型陷入困惑。作者受到启发，开始在文章中使用类似的方法，即在文字或表情符号后添加变体选择符（Variation Selector），这些选择符在视觉上不可见，但会增加系统的字数统计。通过这种方式，作者成功将一篇文章的字数从2000字增加到近3万字，而实际内容并未增加。

这种方法的核心在于Unicode编码系统。Unicode为每个字符分配了唯一的编号，而变体选择符可以在字符后添加额外的信息，改变字符的外观或样式。例如，心形符号可以通过添加不同的变体选择符显示为彩色或黑白。作者利用这一特性，在文章中嵌入大量隐藏字符，这些字符在视觉上不可见，但会显著增加系统的字数统计。

当这些带有隐藏字符的文章被输入到AI改写工具时，由于token限制，AI无法处理如此大量的隐藏信息，导致系统崩溃或截断输出。这种方法有效地防止了AI洗稿，尤其是对于依赖token限制的模型如GPT-4和Gemini。然而，作者也指出，这种方法对推理模型无效，且不会影响RAG和知识库的正常问答功能。

作者进一步解释了Unicode的工作原理，强调变体选择符就像在文字上贴了一层透明胶带，虽然肉眼看不见，但系统可以解析这些隐藏信息。通过在文章中嵌入大量变体选择符，作者成功制造了“Token炸弹”，使得AI在处理这些文章时无法正常工作。

总结来说，作者通过利用Unicode的变体选择符特性，成功开发出一种防止AI洗稿的方法。这种方法虽然简单粗暴，但在一定程度上有效限制了AI对原创内容的抄袭行为。