跳到主要内容

Codex 新手指南:用 OpenAI 的编程 Agent 完成第一个任务

先说结论

Codex 是 OpenAI 做的编程 Agent,专门用来在项目里执行任务。新手可以从 App、IDE extension、CLI 或 Cloud 入口开始;如果你已经在用 ChatGPT 或 OpenAI 生态,Codex 是自然的下一步。

四个入口怎么选

入口适合场景新手建议
Codex App本地项目、图形界面、想直接选文件夹偏好图形界面时优先尝试
IDE extension想在 VS Code、Cursor、Windsurf 里使用编辑器用户优先
CLI终端工作流、Linux、脚本化任务终端用户优先
CloudGitHub 仓库、云端环境、远程任务、PR review需要连接 GitHub、配置云端环境,并确认 workspace / admin 权限;PR 仍要人工 review

CLI 第一次怎么装

如果你选择 npm 安装,先确认电脑里有 Node.js 和 npm;如果选择 Homebrew 安装,先确认 brew 可用。安装命令建议在普通终端里运行,不要一开始就在高权限或不熟悉的 shell 环境里操作。

npm install -g @openai/codex

或:

brew install codex

安装后可以先检查版本:

codex --version

如果当前版本没有这个命令,也可以直接运行 codex,确认它能正常启动。真正开始用时,建议进入项目根目录再运行:

codex

在授权 Codex 修改文件前,先确认这个项目已经放在 Git 仓库里。最简单的检查方式是在项目根目录运行 git status,确保后续每一次改动都能被 diff 和回滚。

首次运行会提示用 ChatGPT 账号或 OpenAI API key 登录。Cloud/Web 通常还需要连接 GitHub 仓库。

第一次让 Codex 改代码的安全流程

第一次不要直接让 Codex 大改。可以按这个小循环来:

  1. 在项目根目录先运行 git status,看清楚当前有没有未提交改动。
  2. 如果已经有重要改动,先提交、stash,或者创建一个新分支 / checkpoint。
  3. 先让 Codex 阅读相关文件并提出计划,不要马上改代码。
  4. 让 Codex 只做一个小改动,例如修一个明确 bug、改一个文案、补一个测试。
  5. 改完后运行 git diff,检查改了哪些文件、有没有无关重写、配置变化、删除已有逻辑,或者把 secret / token 写进文件。
  6. 运行相关验证命令,例如 linttypechecktestbuild
  7. 只有在人工 review 和验证通过后,再接受这次改动并提交。

第一个推荐 Prompt

请先阅读这个项目,回答:
Goal: 我想了解这个项目如何运行。
Context: 你可以查看 README、package.json、docs 和主要源码目录。
Constraints: 先不要修改文件,也不要运行破坏性命令。
Done when: 给我一个项目结构说明、常用命令列表,以及建议的第一个小任务。

新手 Prompt 模板

Goal: [我要完成什么]
Context: [相关文件、报错、页面、命令输出]
Constraints: [不要做什么、权限边界、代码风格]
Done when: [什么结果算完成,例如 build 通过、bug 不再复现、测试通过]

如果 Context 里包含很长的日志、diff 或需求文档,发送前先用 Token Counter 估算上下文占用。估算结果可以帮你判断是删掉噪音、先摘要证据,还是把任务拆成多个小任务。

复杂任务先 Plan

复杂任务不要直接让 Codex 写代码。先让它计划、提问、澄清范围,再进入实现。一个好计划得告诉你改哪些文件、怎么验证、哪里有风险。

用 AGENTS.md 固化规则

当你发现自己反复提醒同一件事,例如使用 pnpm、不要改无关文件、提交前跑 typecheck,就应该把这些规则写进 AGENTS.md

安全边界

新手先使用默认权限。只有在可信仓库、清楚知道影响范围、并且已经有 Git 检查点时,才考虑放宽权限。不要把高权限模式当成默认效率技巧。

常见问题

Codex 和 ChatGPT 有什么区别?

ChatGPT 更像对话窗口,Codex 更像能在项目里执行任务的编程 Agent。它可以读文件、改文件、运行命令,并围绕一个任务推进。

Codex 和 Claude Code 怎么选?

如果你已经在 ChatGPT / OpenAI 生态里,先试 Codex;如果你已经在 Claude / Anthropic 生态里,先试 Claude Code。新手最重要的是学会安全工作流,而不是同时购买所有工具。

Codex 能不能自动完成整个项目?

不要这样期待。它适合推进明确任务,但产品判断、架构选择、安全审查、最终验收仍然需要人负责。

相关阅读