文章摘要
【关 键 词】 智能体、AI代理、多任务处理、安全保护、合作探索
OpenAI在2025年初推出了首款智能体产品Operator(预览版),这款AI智能体能够模仿人类使用计算机,无需依赖特定API接口,适配任何为人类设计的软件界面,展现了极高的灵活性。Operator基于OpenAI新研发的Computer-Using Agent(CUA)模型,通过感知-推理-行动循环技术实现,包括屏幕截图、视觉理解、强化学习推理和虚拟操作执行。预览版目前仅对美国Pro用户开放,月费200美元。
在直播展示中,Operator展现了多种智能场景应用,包括智能餐厅预订、购物助理和多任务并行处理。它能够自动更正错误信息、识别手写购物清单并自动搜索商品,以及同时处理多个任务。在性能测试中,CUA在WebArena和WebVoyager上表现良好,尽管在OSWorld上与人类水平有差距,但已超越其他公开结果。
安全性方面,Operator构建了多层保护机制,包括用户确认、实时监控、网站限制、隐私保护和用户控制功能。OpenAI计划在未来两周内向开发者开放CUA模型API,并集成到ChatGPT中。同时,OpenAI已与多家品牌建立合作,探索AI Agent在各领域的应用潜力。尽管Operator目前功能有限,地域限制在美国,但OpenAI已有明确扩展计划,预示着AI Agents领域将进入新的发展阶段。
原文和模型
【原文链接】 阅读原文 [ 1491字 | 6分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...