DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

2,726 0 0

文章摘要

DeepSeek V3-0324的发布虽然被官方称为“小版本升级”，但实际表现却远超预期。该版本在多个测试中展现出显著的能力提升，尤其是在复杂问题的处理上。例如，在4维空间超立方体的小球弹跳测试中，DeepSeek V3-0324表现出色，甚至能够应对更高难度的挑战。在编程领域，该模型仅需一句提示词即可开发出完整的自适应布局产品着陆页，其表现被认为与Claude 3.7 Sonnet相当。尽管正式测评结果尚未公布，但在开发者Xeophon的个人Benchmark测试中，DeepSeek V3-0324的所有指标均有大幅提升，成为该测试下最好的非推理模型。

DeepSeek V3-0324并非推理模型，但在处理问题时仍展现出一定的思维方式。当遇到难题时，模型能够自主回到上一步重新思考，这种能力在处理复杂问题时尤为重要。例如，在面对“让7米长的甘蔗通过2米高1米宽的门”这一难题时，模型起初陷入误区，但在重新思考后，突然意识到隐藏条件，并最终得出了解决方案。这一过程类似于DeepSeek-R1技术报告中的“啊哈时刻”，即顿悟后迅速找到正确路径。尽管模型在计算过程中仍未完全理解问题的本质，但其表现已足以证明其强大的问题解决能力。

DeepSeek V3-0324继续保持免费和开源的特点，权重文件已迅速上线HuggingFace，采用最宽松的MIT协议。所有权重文件占硬盘空间约688GB，与初代V3保持一致，表明其依然是671B参数的MoE模型。目前，官方尚未公布更多技术细节，用户可通过官网、官方APP（关闭深度思考功能）以及HuggingFace等渠道体验V3-0324。此外，用户还可以在大模型竞技场中与其他模型进行PK，但投票结果还需等待一段时间才能公布。

随着V3的更新，用户对R2版本的期待也日益高涨。尽管官方尚未透露R2的具体发布时间，但V3的出色表现无疑为未来的更新奠定了坚实的基础。DeepSeek V3-0324的发布不仅展示了其在复杂问题处理上的强大能力，也进一步巩固了其在开源AI模型领域的领先地位。