Codex 新手指南:用 OpenAI 的编程 Agent 完成第一个任务
先说结论
Codex 是 OpenAI 做的编程 Agent,专门用来在项目里执行任务。新手可以从 App、IDE extension、CLI 或 Cloud 入口开始;如果你已经在用 ChatGPT 或 OpenAI 生态,Codex 是自然的下一步。
四个入口怎么选
| 入口 | 适合场景 | 新手建议 |
|---|---|---|
| Codex App | 本地项目、图形界面、想直接选文件夹 | 偏好图形界面时优先尝试 |
| IDE extension | 想在 VS Code、Cursor、Windsurf 里使用 | 编辑器用户优先 |
| CLI | 终端工作流、Linux、脚本化任务 | 终端用户优先 |
| Cloud | GitHub 仓库、云端环境、远程任务、PR review | 需要连接 GitHub、配置云端环境,并确认 workspace / admin 权限;PR 仍要人工 review |
CLI 第一次怎么装
如果你选择 npm 安装,先确认电脑里有 Node.js 和 npm;如果选择 Homebrew 安装,先确认 brew 可用。安装命令建议在普通终端里运行,不要一开始就在高权限或不熟悉的 shell 环境里操作。
npm install -g @openai/codex
或:
brew install codex
安装后可以先检查版本:
codex --version
如果当前版本没有这个命令,也可以直接运行 codex,确认它能正常启动。真正开始用时,建议进入项目根目录再运行:
codex
在授权 Codex 修改文件前,先确认这个项目已经放在 Git 仓库里。最简单的检查方式是在项目根目录运行 git status,确保后续每一次改动都能被 diff 和回滚。
首次运行会提示用 ChatGPT 账号或 OpenAI API key 登录。Cloud/Web 通常还需要连接 GitHub 仓库。
第一次让 Codex 改代码的安全流程
第一次不要直接让 Codex 大改。可以按这个小循环来:
- 在项目根目录先运行
git status,看清楚当前有没有未提交改动。 - 如果已经有重要改动,先提交、stash,或者创建一个新分支 / checkpoint。
- 先让 Codex 阅读相关文件并提出计划,不要马上改代码。
- 让 Codex 只做一个小改动,例如修一个明确 bug、改一个文案、补一个测试。
- 改完后运行
git diff,检查改了哪些文件、有没有无关重写、配置变化、删除已有逻辑,或者把 secret / token 写进文件。 - 运行相关验证命令,例如
lint、typecheck、test或build。 - 只有在人工 review 和验证通过后,再接受这次改动并提交。
第一个推荐 Prompt
请先阅读这个项目,回答:
Goal: 我想了解这个项目如何运行。
Context: 你可以查看 README、package.json、docs 和主要源码目录。
Constraints: 先不要修改文件,也不要运行破坏性命令。
Done when: 给我一个项目结构说明、常用命令列表,以及建议的第一个小任务。
新手 Prompt 模板
Goal: [我要完成什么]
Context: [相关文件、报错、页面、命令输出]
Constraints: [不要做什么、权限边界、代码风格]
Done when: [什么结果算完成,例如 build 通过、bug 不再复现、测试通过]
如果 Context 里包含很长的日志、diff 或需求文档,发送前先用 Token Counter 估算上下文占用。估算结果可以帮你判断是删掉噪音、先摘要证据,还是把任务拆成多个小任务。
复杂任务先 Plan
复杂任务不要直接让 Codex 写代码。先让它计划、提问、澄清范围,再进入实现。一个好计划得告诉你改哪些文件、怎么验证、哪里有风险。
用 AGENTS.md 固化规则
当你发现自己反复提醒同一件事,例如使用 pnpm、不要改无关文件、提交前跑 typecheck,就应该把这些规则写进 AGENTS.md。
安全边界
新手先使用默认权限。只有在可信仓库、清楚知道影响范围、并且已经有 Git 检查点时,才考虑放宽权限。不要把高权限模式当成默认效率技巧。
常见问题
Codex 和 ChatGPT 有什么区别?
ChatGPT 更像对话窗口,Codex 更像能在项目里执行任务的编程 Agent。它可以读文件、改文件、运行命令,并围绕一个任务推进。
Codex 和 Claude Code 怎么选?
如果你已经在 ChatGPT / OpenAI 生态里,先试 Codex;如果你已经在 Claude / Anthropic 生态里,先试 Claude Code。新手最重要的是学会安全工作流,而不是同时购买所有工具。
Codex 能不能自动完成整个项目?
不要这样期待。它适合推进明确任务,但产品判断、架构选择、安全审查、最终验收仍然需要人负责。