
文章摘要
DeepSeek在3月24日发布了V3的小版本迭代“DeepSeek-V3-0324”,并在3月25日晚发布了官方报告。此次更新主要聚焦于推理能力、前端开发能力、中文写作能力和中文搜索能力的强化,体现了实用性的显著提升。尽管被称为“小版本”,V3-0324在多个关键能力上实现了突破,尤其是代码生成能力的提升令人印象深刻。用户只需关闭深度思考模式即可体验新版本,API接口和使用方式保持不变。
推理能力的提升主要体现在百科知识、数学和代码任务的表现上,特别是在数学和代码类评测集上,V3-0324的得分超过了GPT-4.5和Claude-Sonnet-3.7。过去,DeepSeek的R1模型专注于推理,而V3更适合日常对话。此次V3的推理能力升级,使得用户可以根据任务难度选择合适的模型:复杂问题用R1,日常对话用新版V3。这种差异化策略优化了算力资源的分配,避免了不必要的计算浪费。
在前端开发能力方面,V3-0324的表现尤为突出。开发者报告生成800行代码无一错误,这种稳定性在AI编程工具中显得尤为突出。尽管与顶级模型如Claude仍有差距,但V3-0324在前端视觉设计上已接近这些顶级模型。用户只需提供简单提示,即可生成布局合理、视觉效果精美的数字营销页面,大大缩短了从创意到实现的时间。DeepSeek官方技术报告中也展示了模型的前端代码能力,例如一个p5.js小球物理运动程序,不仅功能完整,还具有高度的美观性和交互性。
V3-0324的另一个亮点是其免费使用和低廉的付费API价格,据测算,付费API的价格比竞争对手便宜了15倍。此外,DeepSeek R1的写作能力也在此次更新中得到了延续和提升,特别是在中长篇文本创作上,质量更高,结构更完整,逻辑更严密。联网搜索场景下的报告生成能力也有显著提升,模型能够从网络信息中提取关键内容,生成详实准确的报告,并以清晰美观的排版呈现。
在开源方面,DeepSeek继续保持透明度和友好性。私有化部署只需更新少量文件,现有用户升级成本极低,几乎可以无缝迁移。模型参数约660B,略低于原先V3的671B,开源版本上下文长度为128K,依然采用MIT许可证,使得开发者可以在各种场景下自由使用。
此次更新虽然能力提升幅度不小,但DeepSeek并未将其称为V3.5或V3.7,而是定义为一次V3小版本更新。这种低调务实的姿态赢得了开发者社区的尊重。尽管没有大的技术路线突破,但此次更新为未来的R2发布奠定了基础,预计R2将是一次名副其实的重大升级。
此次更新还展示了DeepSeek未来的技术路线,即将V系列和R系列融合成一个新模型。官方报告明确指出,此次更新与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法,并借鉴了DeepSeek-R1模型训练过程中的强化学习技术。这种纯RL路线的验证和公示,继续通过开源为行业提供公开的高效迭代思路,与竞争对手的闭源策略形成鲜明对比。
DeepSeek此次更新不仅展示了其在多个领域的显著进步,还通过开源和透明的方式,为行业提供了新的技术思路和方向。未来,随着R2的发布,DeepSeek有望在AI领域实现更大的突破。
原文和模型
【原文链接】 阅读原文 [ 1614字 | 7分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆