乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
文章摘要
【关 键 词】 AI工具、实时API、视觉微调、模型蒸馏、开发者大会
在最近举行的第二届OpenAI DevDay开发者大会上,OpenAI并没有推出任何重大的新产品,而是选择对其现有的AI工具和API进行了一系列增量改进。这些改进包括视觉微调、实时API、模型蒸馏和提示缓存四大API新功能,显示出OpenAI的战略转变,即更多地赋予其开发者生态系统能力,而非直接在最终用户应用领域竞争。
实时API的公测版允许开发者在应用程序中构建低延迟、多模态的体验,类似于ChatGPT的高级语音模式,支持6种预设语音进行自然的语音到语音对话。此外,聊天完成API增加了音频输入和输出功能,支持不需要实时API低延迟优势的使用场景。实时API通过直接流式传输音频输入和输出来改进会话体验,自动处理中断,简化了构建语音助手和其他会话AI工具的过程。
视觉微调功能允许开发者使用图像和文本来自定义GPT-4o模型的视觉理解能力,以实现增强的视觉搜索功能、改进自动驾驶汽车或智能城市的物体检测,以及更准确的医学图像分析等应用。例如,Grab公司利用这项技术改进了其地图服务。
提示缓存功能旨在降低开发者成本和延迟,通过自动对模型最近处理过的输入tokens应用50%的折扣,对于频繁重复使用上下文的应用来说,这可能会带来成本的大幅降低。
模型蒸馏允许开发者使用高级模型的输出来提高更小、更经济的模型的性能,使它们能够在特定任务上以更低的成本匹配高级模型的性能。这解决了AI行业中长期存在的一个分歧,即尖端、资源密集型系统与更易访问但能力较弱的对应系统之间的分歧。
尽管今年的开发者大会稍显低调,但这些改进和新功能的推出,为开发者提供了更多的工具和可能性,以构建更高效、更经济的AI应用程序。OpenAI的这一战略转变,优先考虑生态系统的发展,而不是仅发布吸引人眼球的重磅产品,可能会对AI行业产生深远的影响。
原文和模型
【原文链接】 阅读原文 [ 2690字 | 11分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★