标签:性能崩溃

质疑DeepSeek-R1、Claude Thinking根本不会推理!苹果争议论文翻车了?

当前人工智能领域普遍认为以DeepSeek-R1、Claude 3.7 Sonnet为代表的推理大模型已具备类人思考能力,但苹果团队的最新研究对此提出根本性质疑。通过设计可控...