Agent 要被吃进大模型了

文章摘要
OpenAI近期发布了全新的o系列模型,包括满血版o3和o4-mini,这两款模型在性能和价格上均实现了显著提升。o3在多个基准测试中刷新了纪录,尤其在编程、商业咨询和创意构思领域表现突出,比前代模型减少了20%的重大错误。o4-mini则专为高效推理任务设计,支持更高的使用频率,并在数学、编程和视觉任务中取得了接近满分的成绩。两款模型首次实现了将图像直接融入思维链的能力,显著提升了多模态任务的表现。
OpenAI首席研究官Mark Chen强调,o系列模型能够自由调用ChatGPT中的各种工具,标志着模型在端到端使用工具能力上的重大突破。这一能力使得模型从“聪明大脑”进化为了“灵巧双手”,能够跨工具完成复杂任务,为用户带来极大便利。OpenAI在Agent领域的布局也进一步深化,通过强化学习与基座模型的结合,OpenAI在Agent研发中占据了天然优势。Deep Research团队认为,强化学习的端到端训练是Agent技术变革的关键,而OpenAI在基础模型上的强大能力使其在Agent开发中事半功倍。
此外,OpenAI还开源了本地代码智能体Codex CLI,这款工具能够直接在终端命令行中运行,支持多模态编程,甚至可以通过截图或手绘草图进行代码交互,刷新了代码理解的边界。Codex CLI的发布进一步展示了OpenAI在模型推理能力与本地开发环境紧密结合上的创新。
总体来看,OpenAI通过o系列模型的发布和Codex CLI的开源,不仅在模型性能和多模态能力上实现了重大突破,还在Agent领域展现了强大的技术优势。这些进展不仅推动了AI技术的演进,也为未来的应用场景提供了更多可能性。
原文和模型
【原文链接】 阅读原文 [ 1859字 | 8分钟 ]
【原文作者】 AI科技评论
【摘要模型】 deepseek-v3
【摘要评分】 ★★★☆☆