对话DeepSeek:如何看待你同时登顶中美App Store应用榜单?|钛媒体AGI
文章摘要
【关 键 词】 AI助手、开源模型、技术民主化、智能竞赛、算力市场
DeepSeek应用近期在全球AI领域引起巨大关注,其下载量在美国和中国地区均登顶苹果应用商店免费APP下载排行榜,超越了ChatGPT等知名应用。这款由国产大模型公司深度求索开发的AI助手类产品,以其高性价比和开源特性在海外开发者社区中引起轰动。DeepSeek-R1模型在数学、代码、自然语言推理等任务上的性能与OpenAI的o1模型相当,采用MIT许可协议,支持免费商用和衍生开发。
DeepSeek-R1的预训练费用仅为557.6万美元,远低于OpenAI GPT-4o模型的训练成本,且在后训练阶段大规模使用强化学习技术,提升了模型推理能力。DeepSeek还将R1训练技术全部公开,并蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。其核心技术因素包括低精度计算、小参数量和高质量数据等,使用数据蒸馏技术提升了训练效率。
DeepSeek R1模型的查询成本远低于OpenAI,且允许开源,这给华尔街算力板块投资人带来了压力。DeepSeek的成功被视为技术民主化的胜利,用户信任的体现,以及开放生态的裂变。金沙江创业投资基金主管合伙人朱啸虎认为DeepSeek的成功是技术理想主义者的胜利,行业技术迭代周期远快于资本支出的回报周期,整个LLM行业都需要重塑估值体系。
英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是首个展示了强化学习飞轮可以发挥作用且能带来持续增长的开源软件项目。AI科技初创公司Scale AI创始人亚历山大·王认为,DeepSeek的AI大模型性能与美国最好的模型相当,可能会改变人工智能竞赛的格局。
开源模型DeepSeek R1还引发了一股“复现热潮”,例如HuggingFace在GitHub上发起的Open R1项目。Meta迅速采取行动,组建了多个小组来研究DeepSeek的技术细节,希望在即将发布的Llama 4中实现技术突破。DeepSeek的冲击也影响了全球算力市场,A股寒武纪持续走低,日本半导体股下挫,美股纳指期货领跌。分析师认为,DeepSeek可能代表了对美国股市最大的威胁,因为它以极低的价格建立了一个突破性的人工智能模型,而无需依赖最先进的芯片。
原文和模型
【原文链接】 阅读原文 [ 2257字 | 10分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★