GPT-5难产，外媒爆料：性能提升不大，OpenAI高管Slack上当众破防

AIGC动态1个月前发布 almosthuman2014

946 0 0

文章摘要

GPT-5的改进虽显著，但性能飞跃不及早期版本。OpenAI即将发布的新一代旗舰模型在编程、数学及复杂任务处理方面展现出更强的能力，例如能更高效地生成高质量代码，并减少人工监督需求。然而，知情人士指出，这些进步无法与GPT-3到GPT-4的跨越式提升相比，反映出技术瓶颈的客观存在。模型性能提升的放缓可能影响OpenAI在AI领域的领先地位，但渐进式改进仍能推动商业需求，并为公司450亿美元的GPU采购计划提供信心。

自动化编码能力成为OpenAI的核心战略方向。内部评估显示，提升AI自动执行编码任务的能力已被列为优先事项，这不仅关乎商业竞争力，还与实现研究工作的自动化密切相关。微软测试结果表明，GPT-5能在不增加计算资源消耗的情况下生成更优的代码和文本答案，部分归功于其动态分配计算资源的能力。这一进展与OpenAI高管对“GPT-8”目标的乐观预期相呼应，CEO山姆・奥特曼公开表示现有技术路径有望实现与人类智能比肩的AGI。

组织内外的双重压力制约发展步伐。OpenAI面临微软合作中的技术授权争议，以及Meta高薪挖角导致的人才流失。研究副总裁Jerry Tworek公开抱怨团队变动，反映出管理层的不稳定性。此外，Orion模型的失利暴露了预训练阶段的局限性——优化方法在模型规模扩大后失效，加之高质量数据匮乏，最终迫使OpenAI将其降级为GPT-4.5发布。这些挑战凸显出持续创新的难度，尤其是在与谷歌、Anthropic等资金雄厚的对手竞争时。

技术突破与挫折并存。推理模型o3的母模型通过增加英伟达芯片和网络搜索能力实现了显著进步，但在转化为ChatGPT版本时性能大幅衰减，可能与人类语言交互的适配性不足有关。尽管如此，o3仍在科学领域展现出实用价值。OpenAI将希望寄托于“通用验证器”技术，该系统能自动评估模型答案质量，已在数学和创意写作等多元场景中验证有效性。强化学习负责人Tworek认为，这一技术可能是实现AGI的关键要素。

资本市场的狂热追捧为技术攻坚提供后盾。OpenAI以3000亿美元估值完成83亿美元融资，超额完成原定计划，投资者包括Dragoneer、黑石集团等顶级机构。ChatGPT用户超7亿、年收入逼近130亿美元的亮眼数据，以及与美国政府的合作前景，共同推动了资本信心。奥特曼在公开场合强调GPT-5的“全面超越人类”潜力，进一步强化了市场预期，但技术团队内部清醒认识到，两个月前的开发成果尚不足以冠名GPT-5，显示理想与现实仍存差距。