官方原文索引: Configuration Reference / Model Context Window / Best Practices
1. 核心架构与原理解析
Codex 的成本主要来自Token 消耗,理解其计费模型是优化的前提:
Token 消耗构成:
上下文窗口管理:
| 模型 | 上下文上限 | 自动压缩阈值 | 特性 |
|---|---|---|---|
| GPT-5-Codex | 200K | 可配置 | 满血能力,成本最高 |
| GPT-5.3-Codex | 128K | 可配置 | 性价比平衡 |
| GPT-5.3-Codex-Spark | 128K | 可配置 | 轻量快速,成本低 |
成本估算公式:
单次任务成本 ≈ (系统提示 Token + 历史 Token + 输入 Token) × 输入单价
+ 输出 Token × 输出单价
🛠️ 专家视角 / 架构思考: Codex 的计费不是按"任务数",而是按"Token 数"。一个"优化代码"的任务可能消耗 5K Token,而一个"分析整个项目架构"的任务可能消耗 50K Token。优化策略的核心是减少不必要的上下文传输。
2. 工程落地与代码示例
Token 预算配置
# ~/.codex/config.toml
model = "gpt-5.3-codex"
model_auto_compact_token_limit = 100000 # 达到 10万 自动压缩
# 预算硬上限(防止意外高额消费)
max_budget_usd = 10.0
# 审查用轻量模型
review_model = "gpt-5.3-codex-spark"成本优化策略清单
# 策略 1:AGENTS.md 精简(减少系统提示 Token)
# 删除通用规范,保留项目特定规则
# 优化前:AGENTS.md 30KB → 优化后:15KB
# 节省:每次请求省 ~15K Token
# 策略 2:多用 @ 引用(避免粘贴大段代码)
> 检查 @src/auth.ts 第 45-60 行
# 比粘贴 60 行代码节省 80% Token
# 策略 3:定期 /compact
# 长会话每 10 轮压缩一次
# 节省:释放 50-70% 历史上下文 Token
# 策略 4:子 Agent 模型降级
# 审查任务用 Spark,仅核心开发用满血模型
# 节省:审查成本降低 60%+
# 策略 5:限定文件范围
> 只在 src/components/ 目录下修改
# 避免 Agent 扫描无关文件
# 策略 6:分阶段交付
# 大任务拆分为多个小任务,每个任务独立会话
# 避免单会话上下文膨胀成本监控脚本
#!/bin/bash
# codex-cost-monitor.sh
LOG_FILE="$HOME/.codex/cost.log"
echo "=== Codex 成本监控 ==="
echo "时间: $(date)"
# 统计今日请求数
REQUESTS_TODAY=$(grep "$(date +%Y-%m-%d)" "$LOG_FILE" 2>/dev/null | wc -l)
echo "今日请求数: $REQUESTS_TODAY"
# 估算今日成本(简化计算)
AVG_COST_PER_REQUEST=0.05 # $0.05/请求
ESTIMATED_COST=$(echo "$REQUESTS_TODAY * $AVG_COST_PER_REQUEST" | bc)
echo "估算今日成本: \$$ESTIMATED_COST"
# 检查预算
DAILY_BUDGET=5.0
if (( $(echo "$ESTIMATED_COST > $DAILY_BUDGET" | bc -l) )); then
echo "⚠️ 警告:今日成本超过预算 \$$DAILY_BUDGET"
fi模型分级使用策略
3. 场景深入:大规模团队的成本管控
场景:月度成本预算分配
# 团队级配置
team_budget_usd = 5000.0 # 月度预算
per_user_budget_usd = 200.0 # 人均预算
alert_threshold = 0.8 # 80% 触发告警
# 按项目分配
[project.api-gateway]
monthly_budget = 1000.0
priority = "high"
[project.internal-tools]
monthly_budget = 500.0
priority = "low"场景:成本归因分析
# 生成成本报告
codex exec "分析最近一个月的 Codex 使用数据:
1. 按用户统计 Token 消耗 TOP 10
2. 按项目统计成本分布
3. 识别高成本低效任务模式
4. 给出具体优化建议(哪些任务可降级模型)"场景:自动降级策略
# 当预算紧张时自动降级
# codex-budget-guard.sh
CURRENT_COST=$(cat /tmp/codex-monthly-cost)
BUDGET=5000
THRESHOLD=4500 # 90%
if [ "$CURRENT_COST" -gt "$THRESHOLD" ]; then
# 切换到低成本模型
sed -i 's/model = "gpt-5-codex"/model = "gpt-5.3-codex"/' ~/.codex/config.toml
echo "预算接近上限,已自动降级模型"
fi4. 💡 核心避坑与最佳实践 (Takeaways)
- 系统提示常驻消耗:AGENTS.md 的 32KB 每次请求都计费,精简直接省钱
- 工具输出是隐形大户:
cat large.log的结果可能消耗数万 Token,避免无意义的大文件读取 - 自动压缩阈值调优:根据任务复杂度调整,简单任务 80K 压缩,复杂任务 150K
- 模型分级使用:开发用满血,审查用 Spark,文档用 GPT-5.4(更快更便宜)
- 设置硬预算上限:
max_budget_usd防止意外消费,特别是 CI/CD 场景 - 定期审查成本归因:找出"烧钱"任务模式,优化或降级
- 批量任务用 Spark:如统一格式化、简单审查,不要用满血模型浪费钱