系列 · 共 21 篇 · 建议按顺序阅读
Codex 不是 ChatGPT 的终端版。 它是 OpenAI 推出的终端原生自主编程 Agent(Autonomous Coding Agent),核心差异在于:
Codex CLI 是一个基于 Node.js 的 npm 全局包,但其底层核心 Harness 使用 Rust 编写,通过 Node.js 封装暴露给终端。这种混合架构兼顾了 Rust 的性能(文件系统监控、沙盒执行)和 Node.js 的生态(npm 分发、配置管理)。
Codex CLI 支持两种认证方式,其安全模型和适用场景截然不同:
Codex CLI 的交互界面是一个全屏终端 UI(TUI),基于 Rust 的终端渲染引擎构建。理解其输入模式是高效使用的前提:
Codex 的权限控制采用"沙盒(Sandbox)× 审批策略(Approval Policy)"双轨模型。这两个维度正交组合,产生 9 种实际权限状态:
Codex 的 Agentic Workflow 遵循"理解 → 规划 → 执行 → 验证"四阶段循环。对于初学者,掌握如何描述任务边界比掌握命令更重要:
AGENTS.md 是 Codex 的项目级系统提示持久化机制。它的核心作用是:把"每次都要交代一遍的项目规则"写成文件,让 Codex 每次启动自动读取。
Codex 的 Prompt 处理遵循"意图识别 → 上下文加载 → 任务规划 → 执行"四阶段。优质的 Prompt 能显著降低 Token 消耗和提升结果准确率。
Codex 内置的 /review 命令会启动一个独立的只读子 Agent,与当前会话隔离,避免"自我审查"的认知偏差。
Codex 的核心优势不是"生成代码片段",而是理解项目结构后协调跨文件修改。其内部执行流程:
MCP(Model Context Protocol)是 OpenAI 推出的标准化工具集成协议,允许 Codex 调用外部系统(数据库、浏览器、文档平台、GitHub 等)。
高效的 Codex 工作流不是"问一个问题等回答",而是人机协作的流水线。设计良好的工作流应明确:
Codex 的 Subagents 机制支持主 Agent 拆分子任务并行执行,每个子 Agent 拥有独立的模型配置、沙盒权限和上下文窗口。这标志着从"单 Agent 串行"到"多 Agent 协作"的架构跃迁:
Codex 的安全模型采用"沙盒约束 + 审批策略"双轨制:
企业级 Codex 部署需回答三个核心问题:谁在用、做了什么、如何管控。
codex exec 命令提供非交互式执行能力,使 Codex 可嵌入 CI/CD 流水线:
传统安全日志回答"发生了什么"(What),Codex 的 Agent-native 遥测回答"为什么"(Why):
Skill 是 Codex 的可复用工作流单元,区别于一次性 Prompt:
Plugin 是 Skill 的分发单元,支持跨仓库、跨团队共享:
Codex 的成本主要来自Token 消耗,理解其计费模型是优化的前提:
当团队从"个人使用 Codex"扩展到"百人级平台化部署"时,需要解决: