文章摘要
【关 键 词】 API功能、AI模型、视觉微调、实时交互、开发效率
在最近于美国旧金山举行的第二届开发者大会上,OpenAI推出了四项新的API功能,旨在简化模型调用、微调和蒸馏流程,实现高效开发。这些新功能包括实时API、视觉功能引入微调API、API提示缓存和API模型蒸馏。
实时API的公开测试版允许开发者在应用程序中集成低延迟、多模态的生成式AI功能。它支持使用6种预设声音进行语音到语音对话,并引入了聊天完成API中的音频输入和输出功能。实时API的使用成本相对较低,文本输入token的价格为每100万个5美元,输出token为每100万个20美元,音频输入为每100万个100美元,输出为每100万个200美元。
视觉功能引入微调API允许开发者通过图像数据集定制模型,提高其在视觉任务上的性能。这可以应用于视觉搜索、自动驾驶车辆、智能城市物体检测和医学图像分析等领域。视觉微调的过程与文本微调相似,开发者可以准备至少100张图像的数据集来提高GPT-4o的性能。
API提示缓存功能允许开发者重用最近看到的输入token,享受50%的折扣和更快的提示处理时间。该功能会自动应用于最新版本的GPT-4o、GPT-4o mini、o1-preview和o1-mini模型。
API模型蒸馏服务为开发者提供了一个集成的工作流程,直接在OpenAI平台内管理整个蒸馏流程。这包括存储完成、评估集(测试版)和微调。存储完成允许开发者自动捕获和存储模型通过API生成的输入-输出对,用于蒸馏数据集的生成。评估集允许开发者在OpenAI平台上创建和运行自定义评估,以衡量模型在特定任务上的性能。微调服务则允许开发者使用存储完成创建的数据集进行微调工作,并使用评估在微调后的模型上运行评估。
这些新功能的推出,不仅能够降低开发成本,提高处理能力,还能够提升开发者的工作效率,推动生成式AI应用的快速发展。
原文和模型
【原文链接】 阅读原文 [ 2576字 | 11分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★