
文章摘要
【关 键 词】 GPT-4.5、AI模型、高情商、推理学习、性能提升
OpenAI的最新模型GPT-4.5已经发布,这是一个规模更大、知识储备更丰富的模型,其特点在于高情商和类人交互。GPT-4.5向ChatGPT Pro版用户和付费开发者开放,但token定价较高,每1M tokens输入价格为75美元,输出价格为150美元。GPT-4.5在预训练规模上进一步扩展,被设计为一个通用性更强的模型,其秘密武器是无监督学习和推理的结合,使其在不依赖复杂推理的情况下能给出富有创意的回答,同时降低了幻觉率。
在基准测试中,GPT-4.5在数学能力上比GPT-4提升了27%,编码能力提升了7%-10%,在SWE-Lancer评估中超越了o3-mini。GPT-4.5在Cognition编码实测中虽不及Claude 3.7,但明显超越了其他模型。奥特曼(Sam Altman)表示,GPT-4.5让他感觉像在和一个深思熟虑的人交谈,但由于模型庞大且昂贵,目前仅向Pro会员推出,后续会向Plus会员推出,并增加GPU以满足需求。
GPT-4.5通过扩展无监督学习和推理能力提升AI能力,其中推理能力使模型在回应前先思考,提高了在科学、数学等复杂问题上的性能。无监督学习则增加了模型的词汇知识、直觉力,并减少了模型幻觉。GPT-4.5的交互非常自然,被评为OpenAI“迄今最好的聊天模型”,具有更深入的知识和更好的上下文理解能力,在改进写作、编程或解决实际问题等任务上特别有用。
OpenAI研究科学家Noam Brown强调,预训练和思考能力的提升是互补的。GPT-4.5在准确率上超越了其他GPT模型,同时也实现了最低的幻觉率。华人研究者Youlong负责后训练基础设施,他们开发了新的训练机制,用更少的计算开销来微调这样规模的模型。GPT-4.5在问答基准上准确率明显超越了Grok 3、GPT-4o、o3-mini,同时在幻觉方面,GPT-4.5是最低的。
GPT-4.5在人类协作方面表现出色,测试者更喜欢其回答。OpenAI通过scaling训练规模,使其能够解决更复杂问题,并教会它们更深入地理解人类需求和意图。GPT-4.5能更好地理解人类的意图,并以更高的细腻度、“情商”解读微妙的线索或隐含的期望。此外,GPT-4.5还展现出更强的审美直觉和创造力,在写作和设计方面的协助尤为出色。
原文和模型
【原文链接】 阅读原文 [ 4135字 | 17分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★