GPT-5难产,外媒爆料:性能提升不大,OpenAI高管Slack上当众破防

文章摘要
【关 键 词】 GPT-5、技术改进、自动化编码、组织重组、融资动态
GPT-5的改进虽显著,但性能飞跃不及早期版本。OpenAI即将发布的新一代旗舰模型在编程、数学及复杂任务处理方面展现出更强的能力,例如能更高效地生成高质量代码,并减少人工监督需求。然而,知情人士指出,这些进步无法与GPT-3到GPT-4的跨越式提升相比,反映出技术瓶颈的客观存在。模型性能提升的放缓可能影响OpenAI在AI领域的领先地位,但渐进式改进仍能推动商业需求,并为公司450亿美元的GPU采购计划提供信心。
自动化编码能力成为OpenAI的核心战略方向。内部评估显示,提升AI自动执行编码任务的能力已被列为优先事项,这不仅关乎商业竞争力,还与实现研究工作的自动化密切相关。微软测试结果表明,GPT-5能在不增加计算资源消耗的情况下生成更优的代码和文本答案,部分归功于其动态分配计算资源的能力。这一进展与OpenAI高管对“GPT-8”目标的乐观预期相呼应,CEO山姆・奥特曼公开表示现有技术路径有望实现与人类智能比肩的AGI。
组织内外的双重压力制约发展步伐。OpenAI面临微软合作中的技术授权争议,以及Meta高薪挖角导致的人才流失。研究副总裁Jerry Tworek公开抱怨团队变动,反映出管理层的不稳定性。此外,Orion模型的失利暴露了预训练阶段的局限性——优化方法在模型规模扩大后失效,加之高质量数据匮乏,最终迫使OpenAI将其降级为GPT-4.5发布。这些挑战凸显出持续创新的难度,尤其是在与谷歌、Anthropic等资金雄厚的对手竞争时。
技术突破与挫折并存。推理模型o3的母模型通过增加英伟达芯片和网络搜索能力实现了显著进步,但在转化为ChatGPT版本时性能大幅衰减,可能与人类语言交互的适配性不足有关。尽管如此,o3仍在科学领域展现出实用价值。OpenAI将希望寄托于“通用验证器”技术,该系统能自动评估模型答案质量,已在数学和创意写作等多元场景中验证有效性。强化学习负责人Tworek认为,这一技术可能是实现AGI的关键要素。
资本市场的狂热追捧为技术攻坚提供后盾。OpenAI以3000亿美元估值完成83亿美元融资,超额完成原定计划,投资者包括Dragoneer、黑石集团等顶级机构。ChatGPT用户超7亿、年收入逼近130亿美元的亮眼数据,以及与美国政府的合作前景,共同推动了资本信心。奥特曼在公开场合强调GPT-5的“全面超越人类”潜力,进一步强化了市场预期,但技术团队内部清醒认识到,两个月前的开发成果尚不足以冠名GPT-5,显示理想与现实仍存差距。
原文和模型
【原文链接】 阅读原文 [ 3647字 | 15分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★