文章摘要
【关 键 词】 o1模型、API升级、实时通信、偏好微调、性能优化
OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能,GPT-4o音频成本同样降低60%,mini版本价格降低了10倍。此外,OpenAI推出了偏好微调方法,通过直接偏好优化算法使大模型更好地掌握用户偏好风格。
o1模型API集成了多项新功能,包括函数调用、结构化输出、开发者消息和推理工作量参数。函数调用允许模型自动调用后端服务或外部API处理复杂任务;结构化输出支持JSON格式,便于后续解析与应用;开发者消息赋予开发者更大的控制权;推理工作量参数用于平衡性能与准确性。演示中,o1模型展示了基于高级视觉功能的应用案例,如检测错误表单,并能通过内置函数库与后台服务器通信,获取最新信息,确保结果的准确性和时效性。
实时API增强支持WebRTC,简化了开发流程。WebRTC主要用于实时通信,如会议和视频流传输。OpenAI的实时API支持WebRTC后,AI应用能自动处理互联网变化,如调整比特率和回声消除,提高实时语音应用的性能和稳定性。与Websockets相比,WebRTC支持显著简化了代码,减少了开发者的工作量。演示中,通过简单的HTML代码创建对等连接,实现了音频流的发送和接收,展示了WebRTC支持下实时语音应用开发的便捷性。
偏好微调与传统监督式微调不同,采用成对样本比较学习的方式,使模型理解并适应特定应用场景中的细微差异。开发者需准备包含两个不同版本回答的数据集,模型通过训练学会区分好坏答案,并根据用户反馈调整行为准则。偏好微调适用于对回答格式、语气或抽象特质有较高要求的应用场合,如金融咨询聊天机器人。此外,偏好微调不仅适用于文本生成任务,还适用于图像生成、代码补全等其他类型的输出。通过对大量样例的学习,模型可以形成稳定的行为模式,满足用户需求,并允许持续迭代和改进。这些API现已普遍可用,更多详情可在OpenAI开发论坛查看。
原文和模型
【原文链接】 阅读原文 [ 1241字 | 5分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆