OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
文章摘要
【关 键 词】 AI模型、技术创新、成本降低、性能提升、市场竞争
近期,AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引,这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能,引发了市场对AI硬件需求的担忧,特别是对英伟达高端芯片需求可能减少的担忧。DeepSeek的技术创新受到广泛讨论,被认为是在硬件受限条件下,通过技术创新减少模型对算力的需求,同时提升性能,得到了AI领军人物的认可。
OpenAI首席研究官Mark Chen在社交媒体上表示,DeepSeek独立发现了一些OpenAI在开发o1级别推理模型时的核心理念,但这并不意味着OpenAI在算力上的高投入是不合理的。他强调,拥有预训练和推理两个范式意味着可以在两个维度上优化能力,而不仅仅是低成本。他还提到,随着蒸馏研究的成熟,降低成本和提升能力越来越解耦,低成本服务并不意味着更好的能力。OpenAI将继续提升低成本提供模型服务的能力,同时保持对研究路线图的乐观,并专注于执行。
Mark Chen的言论旨在重塑外界对OpenAI的信心,并预告今年将带来更好的模型。同时,OpenAI研究科学家Noam Brown也在努力弱化外界对OpenAI和DeepSeek的对比,但市场似乎并不买账。
关于DeepSeek-v3的训练成本,外界有过度夸大的反应,特别是关于其训练成本仅为558万美元的说法。实际上,这一成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法、数据相关的前期研究和消融实验的成本。
图灵奖得主、Meta AI首席科学家Yann LeCun认为市场对DeepSeek的成本反应不合理。他指出,巨额投资主要用于让AI服务能够稳定地服务数十亿用户,随着AI能力的增强,维持服务运行的成本会更高,关键在于用户是否愿意为增强的功能付费。许多网友赞同LeCun的观点,认为训练、推理成本更低的AI意味着技术能更快普及,创造更大的市场。
从这个角度来看,DeepSeek在降低推理成本方面的努力似乎比降低训练成本的贡献更值得关注。针对可能即将到来的推理需求激增,OpenAI、Meta等都在做相应准备,如OpenAI的“星际之门”项目和Meta新一年的600亿美元AI投资。2025年,AI市场的竞争依然激烈,DeepSeek在新一年的表现还有待观察。
原文和模型
【原文链接】 阅读原文 [ 1158字 | 5分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆