乏善可陈的第二届OpenAI开发者大会，果然没有掀起太大波澜

AIGC动态1年前 (2024)发布 almosthuman2014

3,018 0 0

文章摘要

在最近举行的第二届OpenAI DevDay开发者大会上，OpenAI并没有推出任何重大的新产品，而是选择对其现有的AI工具和API进行了一系列增量改进。这些改进包括视觉微调、实时API、模型蒸馏和提示缓存四大API新功能，显示出OpenAI的战略转变，即更多地赋予其开发者生态系统能力，而非直接在最终用户应用领域竞争。

实时API的公测版允许开发者在应用程序中构建低延迟、多模态的体验，类似于ChatGPT的高级语音模式，支持6种预设语音进行自然的语音到语音对话。此外，聊天完成API增加了音频输入和输出功能，支持不需要实时API低延迟优势的使用场景。实时API通过直接流式传输音频输入和输出来改进会话体验，自动处理中断，简化了构建语音助手和其他会话AI工具的过程。

视觉微调功能允许开发者使用图像和文本来自定义GPT-4o模型的视觉理解能力，以实现增强的视觉搜索功能、改进自动驾驶汽车或智能城市的物体检测，以及更准确的医学图像分析等应用。例如，Grab公司利用这项技术改进了其地图服务。

提示缓存功能旨在降低开发者成本和延迟，通过自动对模型最近处理过的输入tokens应用50%的折扣，对于频繁重复使用上下文的应用来说，这可能会带来成本的大幅降低。

模型蒸馏允许开发者使用高级模型的输出来提高更小、更经济的模型的性能，使它们能够在特定任务上以更低的成本匹配高级模型的性能。这解决了AI行业中长期存在的一个分歧，即尖端、资源密集型系统与更易访问但能力较弱的对应系统之间的分歧。

尽管今年的开发者大会稍显低调，但这些改进和新功能的推出，为开发者提供了更多的工具和可能性，以构建更高效、更经济的AI应用程序。OpenAI的这一战略转变，优先考虑生态系统的发展，而不是仅发布吸引人眼球的重磅产品，可能会对AI行业产生深远的影响。