成本降低98%！OpenAI开发者大会4大新功能，处理量爆增50倍！

AIGC动态2年前 (2024)发布 AIGCOPEN

2,630 0 0

文章摘要

在最近于美国旧金山举行的第二届开发者大会上，OpenAI推出了四项新的API功能，旨在简化模型调用、微调和蒸馏流程，实现高效开发。这些新功能包括实时API、视觉功能引入微调API、API提示缓存和API模型蒸馏。

实时API的公开测试版允许开发者在应用程序中集成低延迟、多模态的生成式AI功能。它支持使用6种预设声音进行语音到语音对话，并引入了聊天完成API中的音频输入和输出功能。实时API的使用成本相对较低，文本输入token的价格为每100万个5美元，输出token为每100万个20美元，音频输入为每100万个100美元，输出为每100万个200美元。

视觉功能引入微调API允许开发者通过图像数据集定制模型，提高其在视觉任务上的性能。这可以应用于视觉搜索、自动驾驶车辆、智能城市物体检测和医学图像分析等领域。视觉微调的过程与文本微调相似，开发者可以准备至少100张图像的数据集来提高GPT-4o的性能。

API提示缓存功能允许开发者重用最近看到的输入token，享受50%的折扣和更快的提示处理时间。该功能会自动应用于最新版本的GPT-4o、GPT-4o mini、o1-preview和o1-mini模型。

API模型蒸馏服务为开发者提供了一个集成的工作流程，直接在OpenAI平台内管理整个蒸馏流程。这包括存储完成、评估集（测试版）和微调。存储完成允许开发者自动捕获和存储模型通过API生成的输入-输出对，用于蒸馏数据集的生成。评估集允许开发者在OpenAI平台上创建和运行自定义评估，以衡量模型在特定任务上的性能。微调服务则允许开发者使用存储完成创建的数据集进行微调工作，并使用评估在微调后的模型上运行评估。

这些新功能的推出，不仅能够降低开发成本，提高处理能力，还能够提升开发者的工作效率，推动生成式AI应用的快速发展。