标签:开源透明

DeepSeek 颠覆了什么?学习不靠“人盯”,AI自己“卷”自己

DeepSeek 在近期推出的 R1 模型及其 Zero 研究,通过纯强化学习路线实现了推理模型的突破性进展。其核心创新在于证明无需过程监督数据,仅依靠结果控制即可训...