千呼万唤始出来的 GPT 4.5，主打的只是一个“大”

1,204 0 0

文章摘要

OpenAI于2月27日通过直播发布GPT-4.5，标志着其战略定位的重大转变。GPT系列不再作为公司前沿模型的核心，而是逐渐退居为支撑未来推理模型的“技术底座”。此次发布被外界视为防御性动作，主要应对以DeepSeek为代表的开源模型带来的竞争压力。与以往强调基准测试成绩不同，GPT-4.5的亮点聚焦在情感交互、知识准确性与多场景实用性三大维度。

在情感交互方面，GPT-4.5通过深度学习海量对话数据，显著提升“情商”表现。该模型不仅能识别文本中的愤怒、焦虑等情绪，还能解析情感背后的潜在需求，生成具有同理心的回应。例如面对用户抱怨“朋友爽约”，会优先提供情感支持而非机械建议。这种能力源于对语境和情感细微差别的深度解构，官方数据显示其“幻觉率”降至37.1%，较前代大幅优化。

知识体系构建取得突破性进展，预训练算力较GPT-4提升10倍（后从文档删除该数据），实现世界知识的深度扩展。在回答“海水为何是咸的”等事实性问题时，模型能提供结构清晰、包含科学不确定性的解释，并精准捕捉用户隐含需求。例如从“我需要减肥”中识别健康管理诉求，而非简单推荐食谱。多语言支持扩展至14种，斯瓦希里语等低资源语言表现显著提升。

技术架构方面，OpenAI采用跨数据中心协同训练和低精度训练技术，延续了DeepSeek V3引发行业震动的“激进”路线。尽管代码能力仅提升7%-10%，但在SWE-Lancer测试中生成完整软件功能的表现超过GPT-4o。值得注意的是，官方主动披露模型短板：在AIME和GPQA等学术基准测试中，数学与科学问题领先，但其他维度不及DeepSeek和Anthropic的Claude 3.7 Sonnet。

行业竞争格局变化成为重要背景。DeepSeek通过开源策略揭示基座模型与推理模型的技术关联，迫使OpenAI调整产品定位。GPT-4.5的发布“做实”了GPT系列从竞争前线转向基础支撑的角色转变，其训练方法的高效率（跨数据中心资源利用）和规模扩展能力，预示着行业正式进入以推理模型为核心的新竞争阶段。这种转变也体现在技术路线的趋同——OpenAI删除预训练算力数据的行为，反映出对模型“军备竞赛”叙事的有意弱化。

市场影响方面，GPT-4.5的高昂API定价与功能定位形成反差，凸显商业模型与技术演进的矛盾。分析指出，该版本可能是应对开源冲击的临时方案，其“不能太强以免超越主推的o3模型”的设定，暴露出企业在技术路线与市场策略间的平衡困境。随着基座模型时代落幕，以推理效率、场景适配为核心竞争力的新产业周期已然开启。