Codex详细使用教程
雷猴啊朋友们~ 这是一篇 Codex 奶妈级的零基础系统教程!!为了让每个小白都能从 0 掌握 Codex,我花了十几天梳理出这份图文教程,读完知道 Codex 整体能干什么、自己该从哪一关入手,适合先建立全局认知,或者看完视频回来查漏~
一、准备工作
1.1 Claude Code 跟 Codex 的区别
本质上他俩都是从编程 Agent 起家、逐步走向通用 Agent 的产品,分别是 Anthropic 和 OpenAI 出的。功能上,Claude Code 原本是最齐全的,Skill、MCP、斜杠命令、Hook、远程操控这些都是 Claude Code 先发明的。但 Codex 这边后来居上,发了浏览器操控、Computer Use、image2 生图,还有手机端和 Hook——可以直接用手机 ChatGPT 控制电脑上的 Codex 干活。结论是,入门的朋友 Codex 就很强,有条件的朋友 2 个都来很完美。
1.2 基础上手与界面介绍
用 Codex 唯一要准备的,就是一个 ChatGPT 账号。有了账号,直接官网下载安装。进入之后,左边管理对话和任务列表,中间是聊天,右边是结果展示。我们不多纠结,直接开用!
二、能力一:本地文件操作
Codex 可以自主读取和操作你本地的文件,而且不限数量。比如让它根据视频实际内容重命名,它会抽取关键画面判断内容并批量操作。只需要选择一个本地文件夹作为项目,并且选择自动审查模式权限,它就会帮你在该项目内做各种文件操作。不仅能读,还能写、删、移动,这让文件夹成为 Agent 随时获取的上下文。
三、常用功能与上下文管理
对话时会有上下文窗口,当任务告一段落,可以通过 /压缩 释放上下文,或者让它自动压缩。Codex 的额度在界面有清晰显示,甚至可以通过 /状态 随时查看 5 小时限额。模型可以选择更智能或更快速的,另外语音输入功能也非常方便。
四、能力二:命令行工具使用
Codex 在授权情况下可以使用终端执行命令。比如:
- 装环境: 一句话帮我安装 NodeJS 最新版本,甚至各种流行的 Agent(如 Hermes)。
- 软件应用: 可以下载如 Cursor 等软件,作为你的编辑器使用。
- Skill、MCP: 只需要丢给它官方链接,Codex 就能自己安装和验证。
五、能力三:持久记忆
Codex 有两套持久记忆系统:
- 全局 agents.md: 在设置中的自定义指令,适用于所有项目的大原则(如:要说中文)。
- 项目级 agents.md: 只在特定项目生效,可以手动创建或者让 Codex 基于现有项目文件自动帮你写。
另外还有一个实验性的自动记忆功能,会自动总结对话中的经验并保存供日后调用。
六、能力四:图片生成与网页开发(实战:个人主页)
Codex 内置生图功能。如果要开发个人主页,可以开启计划模式,先讨论再动手。Codex 会列出计划,执行过程中如果有偏差,还可以在下次调用时发送反馈,而不是立刻打断;或者用分叉 (Fork) 随时开启新对话。完成后可以用内置的预览浏览器查看,并进行批注修改。
七、能力五:插件使用与部署
通过插件可以连接外部工具和服务。例如安装 Vercel 或 Netlify 插件进行一键部署。特别提到三个重要的操控类内置插件:
- Browser Use: 开新浏览器操作。
- Chrome: 操控你已登录的浏览器(不新开窗口)。
- Computer Use: 操控电脑上的 App(目前仅 Mac 支持)。
八、能力六:把流程沉淀成 Skills
Skills 是把方法和工具组合成的行动指南。除了可以让 Codex 直接帮你找别人写好的 Skill 以外,也可以通过聊天或者跑通流程后自己创建专属 Skill,例如一个自动写 GitHub 热门推荐的技能。
九、能力七与八:MCP、自动化任务及手机控制
MCP(例如连接 NotebookLM 知识库)只需要把链接发给 Codex 即可。而自动化任务可以让 Agent 定时执行(比如每周一早上执行 Skill 发推荐),直接对话说“帮我建一个自动化任务”即可搞定。另外,手机端 ChatGPT 可以通过连接设置,随时随地远控电脑上的 Codex 执行任务。
十、总结
从"问AI"到了"管理AI"的阶段。用 Codex,每个人都得像领导一样:准备上下文、指明目标、检查计划、验收结果,并把好方法沉淀成复用的技能与自动化任务!