
文章摘要
OpenAI 正式发布了 Codex,这是一款基于云端运行的软件工程智能 Agent,旨在协助开发者高效完成编程任务。Codex 的核心功能包括编写功能代码、理解代码结构、回答代码库问题、修复 bug 以及提交可审查的拉取请求(Pull Request)。每个任务都在独立的沙箱环境中执行,用户可实时查看任务进度,并获取包括终端日志和测试记录在内的完整执行结果。Codex 的核心模型为 codex-1,经过专门微调,基准测试得分优于同类模型。
Codex 的设计简洁直观,用户只需通过输入框描述任务,点击「Ask」或「Code」按钮即可启动任务。它的训练方式注重实战,通过在真实开发环境中进行强化学习,生成符合人类编码风格和审查偏好的代码。此外,Codex 还支持用户通过 AGENTS.md 文件自定义行为,使其更贴合具体项目的开发规范与测试标准。
安全性方面,Codex 仅访问用户提供的代码库和预设依赖,不联网或访问外部 API,并经过专门训练以识别并拒绝恶意开发请求。OpenAI 已在内部广泛使用 Codex,显著提升了开发效率,外部合作团队如 Cisco 和 Temporal 也反馈积极。Codex 还展示了其理解代码库结构、自动定位并修复 bug 的能力,甚至能生成修复脚本和测试用例,逐步进化为一个真正的编程协作助手。
Codex 目前向 ChatGPT Pro、Enterprise 和 Team 用户开放,Plus 和 Edu 用户的支持也将很快上线。OpenAI 还推出了专为命令行优化的轻量模型 codex-mini-latest,支持开发者在本地环境快速接入 AI,并通过 Responses API 调用,价格具有竞争力。Codex 的长线愿景是成为未来协作模式的雏形,其多代理、异步执行和自动汇报进度的逻辑可能内嵌进主流开发工具中,成为开发者的「副驾驶」。
尽管 Codex 仍处于研究预览阶段,高级功能如图像输入尚未开放,但它已将对 AI 编程助手的畅想落地为可用工具。知名科技作者 Dan Shipper 认为,Codex 特别适合资深开发者,能够高效生成代码变更并自动提交 PR,但其局限性在于对新手不太友好,且尚未完全整合到主流开发平台。总体而言,Codex 的核心优势在于提高高级开发者的工作效率,使其能够同时管理多个任务,加速开发进程。
原文和模型
【原文链接】 阅读原文 [ 1758字 | 8分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆