刚刚，GPT-4.5震撼上线情商逆天！OpenAI最大最贵模型最像人类，奥特曼带娃缺席

1,191 0 0

文章摘要

OpenAI的最新模型GPT-4.5已经发布，这是一个规模更大、知识储备更丰富的模型，其特点在于高情商和类人交互。GPT-4.5向ChatGPT Pro版用户和付费开发者开放，但token定价较高，每1M tokens输入价格为75美元，输出价格为150美元。GPT-4.5在预训练规模上进一步扩展，被设计为一个通用性更强的模型，其秘密武器是无监督学习和推理的结合，使其在不依赖复杂推理的情况下能给出富有创意的回答，同时降低了幻觉率。

在基准测试中，GPT-4.5在数学能力上比GPT-4提升了27%，编码能力提升了7%-10%，在SWE-Lancer评估中超越了o3-mini。GPT-4.5在Cognition编码实测中虽不及Claude 3.7，但明显超越了其他模型。奥特曼（Sam Altman）表示，GPT-4.5让他感觉像在和一个深思熟虑的人交谈，但由于模型庞大且昂贵，目前仅向Pro会员推出，后续会向Plus会员推出，并增加GPU以满足需求。

GPT-4.5通过扩展无监督学习和推理能力提升AI能力，其中推理能力使模型在回应前先思考，提高了在科学、数学等复杂问题上的性能。无监督学习则增加了模型的词汇知识、直觉力，并减少了模型幻觉。GPT-4.5的交互非常自然，被评为OpenAI“迄今最好的聊天模型”，具有更深入的知识和更好的上下文理解能力，在改进写作、编程或解决实际问题等任务上特别有用。

OpenAI研究科学家Noam Brown强调，预训练和思考能力的提升是互补的。GPT-4.5在准确率上超越了其他GPT模型，同时也实现了最低的幻觉率。华人研究者Youlong负责后训练基础设施，他们开发了新的训练机制，用更少的计算开销来微调这样规模的模型。GPT-4.5在问答基准上准确率明显超越了Grok 3、GPT-4o、o3-mini，同时在幻觉方面，GPT-4.5是最低的。

GPT-4.5在人类协作方面表现出色，测试者更喜欢其回答。OpenAI通过scaling训练规模，使其能够解决更复杂问题，并教会它们更深入地理解人类需求和意图。GPT-4.5能更好地理解人类的意图，并以更高的细腻度、“情商”解读微妙的线索或隐含的期望。此外，GPT-4.5还展现出更强的审美直觉和创造力，在写作和设计方面的协助尤为出色。