Agent 要被吃进大模型了

1,450 0 0

文章摘要

OpenAI近期发布了全新的o系列模型，包括满血版o3和o4-mini，这两款模型在性能和价格上均实现了显著提升。o3在多个基准测试中刷新了纪录，尤其在编程、商业咨询和创意构思领域表现突出，比前代模型减少了20%的重大错误。o4-mini则专为高效推理任务设计，支持更高的使用频率，并在数学、编程和视觉任务中取得了接近满分的成绩。两款模型首次实现了将图像直接融入思维链的能力，显著提升了多模态任务的表现。

OpenAI首席研究官Mark Chen强调，o系列模型能够自由调用ChatGPT中的各种工具，标志着模型在端到端使用工具能力上的重大突破。这一能力使得模型从“聪明大脑”进化为了“灵巧双手”，能够跨工具完成复杂任务，为用户带来极大便利。OpenAI在Agent领域的布局也进一步深化，通过强化学习与基座模型的结合，OpenAI在Agent研发中占据了天然优势。Deep Research团队认为，强化学习的端到端训练是Agent技术变革的关键，而OpenAI在基础模型上的强大能力使其在Agent开发中事半功倍。

此外，OpenAI还开源了本地代码智能体Codex CLI，这款工具能够直接在终端命令行中运行，支持多模态编程，甚至可以通过截图或手绘草图进行代码交互，刷新了代码理解的边界。Codex CLI的发布进一步展示了OpenAI在模型推理能力与本地开发环境紧密结合上的创新。

总体来看，OpenAI通过o系列模型的发布和Codex CLI的开源，不仅在模型性能和多模态能力上实现了重大突破，还在Agent领域展现了强大的技术优势。这些进展不仅推动了AI技术的演进，也为未来的应用场景提供了更多可能性。