信息差

OpenAI重磅发布云端AI编程助手：多任务并行编码时代来临

🧭 什么是 Codex？

Codex 是 OpenAI 推出的一个基于云端的 AI 软件开发助手，可以并行处理多项任务。它的设计目标是：

代替或辅助程序员完成重复、琐碎、耗时的编程任务。

它不仅能写代码、回答关于项目的问题、找出并修复错误，还能完成像“生成测试代码”、“提交 Pull Request（代码合并申请）”这样的标准开发任务。

修复 bug
重构代码
添加测试
审查代码
根据自然语言需求生成代码变更

每一个任务都会在一个隔离的云端环境中执行，这个环境已经预装了你的代码库，因此 Codex 有足够上下文来理解和处理问题。

Codex 是在 OpenAI 的 o3 系列模型基础上专门为软件开发进行了微调（fine-tuned）。

🔧 Codex 能做什么？

Codex 是一个多功能的编程代理系统，具有以下能力：

🔍 Codex 的工作原理详解

Codex 并不是一个简单的代码生成器，而是一个具备自主执行能力的云端 AI 编程代理（agent）。它的运行过程类似于一个远程开发者，在云端为你完成特定任务。

云端执行（不是运行在你电脑上）
任务驱动（你明确给出目标，Codex独立完成）
可追踪（你能看到每一步做了什么）
有限自主（Codex不是“自由发挥”，它是围绕任务高效解决问题）
安全可控（无网络访问，无法泄露数据或访问其他服务）

📊 Codex 模型机制

Codex 使用的是一个名叫 codex-1 的模型，它基于 OpenAI 的 o3 系列优化训练：，它的智能体行为依靠如下机制：

🧱 1. 用户发起任务：输入指令

你作为用户，通过 ChatGPT 的侧边栏或 Codex CLI 工具发出请求，比如：

“为我在项目中添加用户注册功能”
“解释 utils.py 文件里这个函数是干嘛的”
“修复登录流程中的一个 bug”
“帮我写好测试用例并运行看看”

这些请求可以是自然语言，也可以是明确的开发任务说明。

🧠 2. Codex 解析任务：理解意图并规划执行

Codex 使用其背后的大型语言模型 codex-1（一种强化训练过的 AI 模型）来：

理解你的请求
分析项目上下文（代码、结构、已有文件）
制定一个合理的执行策略：比如是新建文件、修改现有文件、运行测试，等等

如果你在代码库中配置了 AGENTS.md 文件，Codex 会参考其中的说明来更准确地完成任务，例如：

如何执行测试（使用哪个命令）
项目的代码风格或开发规范
项目的关键模块或文件结构

🧪 3. Codex 启动隔离环境（沙箱容器）

每个任务都会在云端启动一个完全隔离的执行环境，相当于在云上打开了一个专属的虚拟开发机：

预装了你项目的代码库（通过 GitHub 等集成）
配置好的依赖项、测试框架和工具链
禁用了互联网访问，确保安全（无法访问外部 API）

这个环境中的 Codex 就像“进入了你的项目目录”的远程开发者，有权限查看、运行和修改项目中的文件。

⚙️ 4. Codex 执行任务：写代码 + 运行命令

在环境就绪后，Codex 会开始实际执行任务：

读写文件：创建、修改、重命名代码文件
写代码：使用自然语言转代码的能力，生成合适的函数、类或模块
运行命令：执行测试、运行 linters（代码规范工具）、类型检查等
分析反馈：判断测试是否通过、是否报错，必要时再次调整代码

这是一个闭环的执行过程，直到任务完成或明确失败。

📄 5. 任务完成后 Codex 提供可验证结果

一旦任务结束，Codex 会：

提交更改内容（像开发者提交 Git 提交那样）
提供以下内容供用户验证：
- 代码 diff（改了哪些地方）
- 执行的命令行日志
- 测试通过与失败情况
- 终端截图 / 文件变化概览
你可以：
- 请求 Codex 进一步修改
- 把修改作为 Pull Request 提交 GitHub
- 或直接下载并集成到你本地的项目中

🛠 如何使用 Codex？

使用者可通过 ChatGPT 侧边栏或 Codex CLI 与 Codex 交互：

使用“Code”按钮：让 Codex 执行一个实际编码任务。
使用“Ask”按钮：提问关于代码库的任何问题。
设置 AGENTS.md 文件：这个文件像是“操作说明书”，告诉 Codex 如何测试代码、用哪些工具、项目的代码风格等等。Codex 会按照这个文件更聪明地工作。
任务完成通常需要 1 到 30 分钟，具体取决于复杂程度，您可以实时监控 Codex 的进度。

每一个任务在独立环境中运行，Codex 会自动记录执行日志和测试输出，方便你查看每一步是怎么完成的。

Codex 模式说明

1. 🧠 Ask 模式（只读分析）

适用于：

架构问题解答
可视化请求流（如生成 mermaid 图）
提供代码优化建议（不修改代码）

🔍 示例：

Document and create a mermaidjs diagram of the full request flow from the client endpoint to the database.

2. 🛠 Code 模式（自动修改）

适用于：

Bug 修复
安全审计
自动化代码重构
测试生成
创建 PR 提交代码

🔍 示例：

There's a memory-safety vulnerability in <my package>. Find it and fix it.

📊 性能与效果：Codex 有多强？

训练方式：使用真实软件工程任务 + 强化学习 + 人类代码风格偏好训练。
效果：
- 即使没有手动配置 Codex 环境（比如缺少 AGENTS.md 文件），它也能高质量完成任务。
- 在内部软件工程评估基准中，它完成复杂任务的成功率达 70-80%。
  评估基准：
  - OpenAI 内部 SWE 任务集，验证通过率显著高于 o3 及其他模型。
  - 即使没有辅助文件（如 AGENTS.md）也具备高性能。

此外，Codex 支持上下文长度最高可达 192k tokens，可以理解和处理超大规模项目代码库。

🔐 安全设计与透明性

Codex 在执行时受到多重安全机制约束：

Codex 在设计上充分考虑了安全与可审查性：

所有操作可溯源：每次改动都附带日志、测试结果和文件差异（diff），你可以清楚看到它改了什么。
明确拒绝恶意用途：Codex 被训练为会拒绝生成恶意软件、病毒、钓鱼工具等代码，即使这些技术可能也用于合法场景。
沙箱隔离执行：Codex 无法访问互联网，仅能读取你明确提供的代码与依赖。不会泄露信息或下载未知内容。
用户负责最终代码审查：虽然 Codex 自动化程度高，但用户仍需对最终代码质量与合法性负责。

⚙️ Codex CLI 与轻量版本 codex-mini

OpenAI 同步发布了一个终端工具：Codex CLI，适合本地开发者使用。

它的特点包括：

无需云服务，本地即可调用 Codex 的能力；
支持快速问答、自动补全、重构等任务；
新增轻量模型 codex-mini-latest：
- 运行更快，延迟更低；
- 仍然保持强大的指令理解和代码质量；
- 适合对实时性要求高的任务。

并且，CLI 用户现在可以直接用 ChatGPT 账户登录并配置 API，无需手动生成 Token。Plus/Pro 用户登录后还会获得免费额度。

💰 定价与使用范围

类型可用情况 ChatGPT Pro/Enterprise/Team 用户即日起可使用 Plus / Edu 用户即将开放 Codex CLI / codex-mini 可通过 API 使用，支持计费

Codex-mini 模型 API 定价如下：

输入：$1.50 / 百万 tokens
输出：$6.00 / 百万 tokens
可享 75% Prompt 缓存折扣

🧪 真实使用案例（早期测试者）

以下公司已参与 Codex 的测试与验证：

Cisco：测试如何通过 Codex 加快产品开发和迭代速度。
Temporal：使用 Codex 编写测试、重构代码、调试问题。
Superhuman：将日常重复任务（如测试覆盖率提升）交给 Codex，减轻工程师负担。
Kodiak Robotics：应用于自动驾驶代码调试、工具开发等高复杂度场景。

这些团队反馈，Codex 最适合处理“范围明确、重复性强”的任务，而且建议同时指派多个任务给不同 Codex 实例，提高效率。

📈 未来发展方向

OpenAI 对 Codex 的未来计划包括：

支持任务执行中途交互：用户可随时调整目标或查看中间结果。
与更多工具集成：不仅支持 GitHub，将来还会连接你的 IDE、CI/CD、Issue 追踪系统。
更复杂任务拆解与多代理协作：模拟人类团队工作模式。

最终目标是：让开发者聚焦关键逻辑与设计决策，其他部分由 AI 高效代劳。

官方介绍：https://openai.com/index/introducing-codex/

如果觉得文章对你有用，请随意赞赏

快讯

OpenAI重磅发布云端AI编程助手：多任务并行编码时代来临

https://soraor.com/archives/ai-today_20250519133850

作者

破晓

发布于

2025-05-19

更新于

2025-05-19

许可协议

CC BY 4.0