DeepSeek 发布 V3 模型更新：除了编程能力大幅提升，还有更宽松的开源协议

1,537 0 0

文章摘要

DeepSeek V3 模型的最新更新在编程能力上取得了显著提升，尤其是在前端编码方面。此次更新虽然是小版本升级，但已经在其官方网页、App 小程序等入口开放。新版 V3 模型由新的 32K GPU 集群支持，进一步优化了后训练过程。尽管目前尚未有官方的能力基准测试榜单，但用户的实际测试表明，新版 V3 在编程能力上已经接近 Claude 3.7，后者被广泛认为是目前编程能力最强的模型。

用户通过对比测试发现，新版 V3 在生成前端代码时表现出更高的准确性和复杂性。例如，在生成一个包含 CSS 和 JavaScript 的动画天气卡片时，新版 V3 的生成结果明显优于 R1 模型。此外，与 Claude 3.7 的对比测试也显示，新版 V3 在网站构建效果上已经与 Claude 3.7 相当。这些测试结果表明，新版 V3 在编程能力上的提升是显著的，尤其是在前端开发领域。

除了编程能力，新版 V3 在多轮对话中的上下文理解能力也有所增强。用户反馈显示，新版 V3 在处理复杂对话时表现出更强的连贯性和准确性。这一改进使得新版 V3 在更广泛的应用场景中表现出色，尤其是在需要深度交互的任务中。

另一个重要的更新是开源许可的变更。新版 V3 的开源许可从初代的 Apache 2.0 变更为 MIT 开源许可。这一变更意味着新版 V3 的使用条件更加宽松，尤其是在商业项目中。MIT 开源许可以其商业友好性著称，允许开发者将开源项目与商业和专有软件集成。这一变更预计将吸引更多开发者在商业项目中使用新版 V3 模型，进一步推动其应用和推广。

尽管此次更新主要集中在编程能力和开源许可上，但用户普遍认为，DeepSeek 的 R2 或 V4 模型的发布已经不远。此次更新不仅提升了模型的实际应用能力，也为未来的更大规模更新奠定了基础。总体而言，新版 V3 的发布标志着 DeepSeek 在模型优化和应用扩展方面迈出了重要一步。