AI代码编辑工具使用培训材料:Claude Code 与 Codex 实战全攻略
本文原为内部培训材料,详细讲解了 AI 辅助编程工具在团队中的落地实践。从模型网关的集中管控,到 CLI 工具的选型与进阶技巧,再到多级提示词架构与 Token 成本优化,是一份非常实用的 AI 研发效能升级指南。
Reading System
本文原为内部培训材料,详细讲解了 AI 辅助编程工具在团队中的落地实践。从模型网关的集中管控,到 CLI 工具的选型与进阶技巧,再到多级提示词架构与 Token 成本优化,是一份非常实用的 AI 研发效能升级指南。
在 2024-2026 年,AI 辅助编程已经从早期的"新奇玩具"快速演化为全产研团队的标准生产力设施。今天,面对越发复杂的业务与系统架构,单靠单纯的文本堆砌已经难以满足激增的开发效率诉求。在这个大背景下,我们不仅需要拥抱 AI,还需要以组织的形式系统化地引入强大的工具库。
为了将强大的大模型能力合规、高效地引入团队,我们研发并开源了专属的模型网关服务——CliRelay。
除了作为代码辅助客户端的节点,CliRelay 也为公司内置或定制的 Agent 项目开发提供了极大的支持,主要体现在支持原生的三种主流大模型 API 格式调用:
此外,基于该网关系统的深层可观测性,我们能将 Agent 的上下文进行极其细致的展示,这极大地避免了之前开发 Agent 时经常遭遇的"黑盒感"(即开发者经常不知道模型实际上拼接了什么隐性 Prompt 或调用了何种工具的困境)。
市面上的代码辅助工具层出不穷(如基于网页交互的 ChatGPT,以及重型的 IDE 插件工具),既然如此,为什么我们强烈推荐在工程实战中将 Claude Code 与 Codex 作为第一梯队列装呢?
除开它们作为纯正 CLI 工具能够"原生执行终端命令、直接免复制粘贴改写文件"之外,更具根本战略原因的优势在于:
1. 出自全球顶尖 AI 厂商的官方嫡系产品
2. 繁荣的生态与开源社区沉淀
3. 开阔护城河视野,启发团队打磨自有 Agent 项目
1. Codex (CLI):纪律严明且带着"道德洁癖"的死士特工
2. Claude Code:发散思维的"百无禁忌"架构师
所以到底该用谁?全栈选型备忘录:
核心共性:"基于 Terminal(命令行)原生的能力"才是最高效的沟通手段。因为 AI 能在自己的工作目录下直接看见你报错的依赖、追踪编译历史,使得这二者无论谁出马,都能让交流实现真正的"零障碍透视"。
大家常用的第一梯队 MCP 列举:
1. 最直接(也最推荐)的安装方式:直接吩咐
在 Claude Code 或者 Codex 的终端窗口中,最高效的方式是对其直接下达自然语言 Prompt。例如:"帮我安装 github mcp" 或 "帮我把 context7 mcp 配置接入当前环境,如果没有请自动下载"。这两款业界顶级的客户端会自己利用系统的包管理器,"自己给自己自动完成资源拉取、侦测安装和文件修改",完全无需人类插手。
2. 手动配置位置与说明:
当你在项目中设定了专属的 Skill 后,最震撼的体验在于:Agent 会根据你的对话意图自主分析,极其自然地优先调配你的专属 Skill。 举个例子:当你向系统注册了经过针对性优化的互联网搜索 Skill 后,每当你提问"帮我查询下最新的 AI 相关的新闻"时,它不再走缓慢且冗余的预设系统工具(如 websearch),而是极其聪明地拦截意图并交由你的专属 Search Skill 执行。速度更快、定制化汇总效率更高。
🚨特别提醒:对于 Claude Code 来说,官方在设计上隔离了两个概念: 1. Commands:存放在 commands/ 目录下的孤立单体 .md 提词板文件,偏向轻量调用和指令模板。 2. Skills:存放在 skills/ 目录下的工程化资源。每一个 Skill 必须独占一个专门的文件夹,并以解析 SKILL.md(带YAML头)作为该资源的主入口文件。
1. 项目级别设定(跟随仓库流转的专有规范)
核心定位:必须放入项目 Git 控制下随代码流转。这能确保团队克隆该工程的任何人在使用 Agent 时将被强制匹配这些业务规则。
2. 全局级别设定(伴随自身账户的主干大脑)
核心定位:保存在你自己用来打代码的笔记本电脑总管层里。无论你去写哪一个项目,这组属于这台设备的系统级习惯都会陪伴左右执行。
skills.sh 是 AI 工具里的 NPM,可以发现和索引优秀开源技能。
如何查询与发现好用的开源技能?
/plan 模式是双端共通的防跑偏神器。在对话框中键入 /plan 加上你的需求,大模型将绝对不会立刻动笔改代码,而是会进入"谋定而后动"的纯正架构师状态:扫视与梳理现有项目的上下文 → 拆解详细的任务流水步骤 → 明确列出即将需要修改或创建的文件清单。
🚨 高危防坑警告:如果你的任务预估步骤超过 3 步,强烈建议一定要使用 /plan 开始任务!并且在 AI 输出计划清单后,人类统帅必须非常详细地阅读这份计划。只有在你审查并确认它的拆解思路完全符合你的系统设计预期后,再允许它开始执行。
| 官方真实高频 / 指令 | 核心极简说明与运用场域 | |---|---| | /plan | 谋定而后动:遇到复杂需求时,先让大模型梳理上下文并出具详细的实施步骤清单。 | | /clear | 终局洗牌:完全清空当前对话历史记忆,防止对话太长而白烧大额 Token。 | | /compact | 内存柔性压缩:比一刀切的 /clear 更温和,只清除冗长对白,但会浓缩保留一份结构化摘要。 | | /btw | 侧线平行侦查(By the way):神级指令!在主线调试没断时,用它插入问个毫不相干的快打问题,主线推演完全不会被打断。 | | /resume | 复活历史脑图:随时接回之前的废弃或遗留战局(对话)。 | | /context | 可视化内存雷达:一键呈现此时已经消耗了多少 Context Window 的负载。 | | /mcp & /memory | 装备包挂载查验:用于现场检查所有外接服务是否绿灯,以及统读对当前库的所有层叠记忆。 |
极其重要的高能技巧:终端外置如何极速调取可视化历史?
当你完全退出交互界面的情况下,可以依托于极简的外部启动项选取器光速召回:claude -r(或 --resume)启动时,系统会弹出一个极为华丽的交互式可视化选择面板,里面详列了你当前所在项目目录下的每一场对话快照。
⚠️ 护肝小绝招:如何斩断烦人的 Accept 铁链?
claude --dangerously-skip-permissions进入这个"法外狂徒模式"后,它将不再做任何过问和挽留,全程静默碾压执行。但这招请只用在你绝对信任的沙盒或是完全吃透了的代码库上!
由于模型的每次阅读 Token 是昂贵且有限的,我们需要一套外部大脑方案。在 Claude Code 中,一切记忆持久化的核心在于 CLAUDE.md。
实操步骤:极速构建你工作区(Workspace)的专属架构大脑
实操步骤一:使用内置 /agent 面板交互式配置长效特工
实操步骤二:口语直接触发"一次性"高并发分发
直接向主代理明确发起你的要求:"现在临时创建三个专门检查项目细节的 subagent,让他们作为你的小弟分开去阅读这个项目的所有的细节枝干,最后由你汇总成一份报告,输出到 docs 目录中。"
Claude Code 官方支持在项目根部的 .claude/agents/ 目录中利用极其简单的 Markdown + YAML 语法,精细调教长期干活的"特工小队"。
保姆级实操步骤:纯手工捏造一个死守只读权限的审查官
---
name: "security-scanner"
description: "当用户要求查验项目漏洞、安全合规时,自动调度此特工。它只会看和搜,无写权限。"
tools: Read, Grep, Glob # 严防死守:剥夺写文件、执行 Bash 的功能
model: sonnet # 指定经济款或高智力的具体大模型
---
# 下方的 Markdown 文本将会作为该智能体的底座世界观(System Prompt)
你是一个具有 10 年经验的网络安全攻防专家。
在接到巡检任务后:
1. 请严查代码中是否有硬编码的密钥和密码。
2. 检查 SQL 语句是否存在注入拼装。
3. 输出的报告必须用中文,且按照漏洞严重等级分块。绝对不要修改任何源代码。| Codex 核心级调用指命 | 对接生态作用描述 | |---|---| | codex exec(简写 codex e) | 全能免互动代工:系统在后台立刻自动加载所需的 MCP 和沙盒环境去进行无感运算与执行,无需交互跟盯。 | | codex resume | 唤醒沉睡特工:直接读取过往的会话记忆恢复昨日残留问题。 | | codex mcp | 接驳外星系重火力:官方钦定的专为本地挂载和管理一切远端外设大杀器(MCP 服务引擎)的核心入口。 | | codex sandbox | 单为这个任务部署一个隔离的物理防泄漏"沙漏宇宙",避免一切意外误删跑路事件! |
神鬼莫测的极客权限修饰符:
| Codex 核心实战 / 指令 | 真实使用场域描述 | |---|---| | /plan | 防翻车起手式:强制特工先出具详细的实施步骤和待修改文件表。 | | /new 与 /resume | 时空穿梭机:/new 丢弃包袱当场另起一场新对话;/resume 瞬间接回昨天保存下来的未完赛点。 | | /review | 当场化身代码审查官:Codex 会立刻自主审视当前工作区所有发生的 Diff 变更。 | | /subagents 或 /agent | 影子兵团列阵:查阅、切换正并发活跃着的多个外挂 Agent 线程。 | | /ps 与 /stop | 神级后台进程管控:查重并一键掐断跑偏的底层作业。 | | /permissions | 安全锁喉与免单:在内嵌列表选择把授权度全开,Agent 瞬间变身为全自动跑山机器。 | | /model & /skills | 主权定义:原地切换到智力更猛或推理深度更高的模型兵种;外挂业务辅助动作包。 | | /clear & /compact | 极客防爆双阀门:通过纯净清屏开新局,或在保留浓缩总结的前提下清算无关聊天。 |
不同于别家的单文件死规则,Codex CLI 非常前卫地维系了以 AGENTS.md 体系主导的"级联覆盖式项目大脑"。它能够做到对你的代码实现目录级别的微操管制。
实操步骤:从全局定基调,从局部抓细节
使用 Codex,你甚至可以像一个车间工头那样,在命令行并发派出多支勘探队伍同时审阅代码,来彻底防止传统大模型因为看太多文件导致的注意力腐烂(Context Rot)。
实操步骤:像调度将军一样查验功能分支
当真正的商业级项目落地时,如果你把所有的规章制度、表结构约束和部署规范等海量要素全塞进一个 AGENTS.md 里,会让大模型背上极重的上下文包袱。这不仅导致运行变慢,更极易产生"注意力腐蚀(Context Rot)"。
利用这个如同文件操作系统版的提示器架构设计,能够强力撬动工程上的三大实战红利:
开源指路:RTK 是专为 LLM 生态降低上下文噪音负担而诞生的,其官方开源仓库地址为 https://github.com/rtk-ai/rtk。
RTK(Rust Token Killer)的本质是一个专门服务于大语言模型的跨平台终端底层拦截器:
据实盘统计,通过 RTK 代理日常这些终端查询与读取交互,平均可为您的大项目降低 60%~90% 的洗钱式算力 Token 消耗。
在 Claude Code 与 Codex 中的无痛组合应用
开源指路:OpenSpec 的官方文档及开源 GitHub 仓库地址为 https://github.com/Fission-AI/OpenSpec。
OpenSpec 是一个专为多款 AI 开发助手(高度兼容 Claude Code、Cursor、GitHub Copilot)设计的 规范驱动开发 (SDD) 框架。它旨在让你在真正实施代码前,先和 AI 把方案、架构、数据字典(Specifications)全部敲定成文,进而约束 AI 严格按章写代码。
npm install -g @fission-ai/openspec@latest在引入大模型与 Agent 工作流后,QA 工程师不再需要苦哈哈地一行行手写 Mock 数据和断言。
codex e "基于 /src/news_api 的最新逻辑变动,使用 Jest 帮我生成 10个覆盖极值与异常流的集成测试脚本,并安全地保存到 /tests 目录;如果缺少依赖 mock 请你自行构筑伪造服务。"从此,画图与代码还原之间的工序将被极度下限压缩:
开发工程师在终端直接运行挂载了该授权的 Claude Code,并祭出这行霸道的切图指令:
"使用 pencil mcp 仔细阅读 ~/Documents/todolist.pen 所有的细节,然后使用 react+bun+ts+vite 框架帮我实现这个设计稿的所有功能页面。"
Claude 利用 MCP 高速下潜抓取了该文件的原生坐标图和样式规则树,自主决定好组件的切分布局后开始狂飙输出。运行 npm run dev 调起开发环境预览——一套带有绝美质感、结构严密且像素级完美还原的前端骨架已然真实跑通!
利用 Claude Code 超强的"架构大局观"编写顶层调度控制流,然后通过它内置的沙箱权限,自动通过 CLI 执行唤起底层专门干脏活重活的 Codex 进程。让它们之间互相生成指令对答,实现"AI 高管指挥 AI 工兵"的惊艳自动流水线。
通过外接 Mem0 这个针对大模型定制的终长线多模态记忆管理引擎。让智能助手随着时间累积,永久、深度记住你的开发习惯、团队私有架构白皮书。
直接启动匹配你 Obsidian 本地笔记系统的专属 MCP 服务。它将允许大模型瞬间长出触角,直接扫描你沉淀了数年的私人 Markdown 知识卡片网络。
gstack 是 Y Combinator 现任总裁 Garry Tan 强烈推荐并开源的 Claude Code / Codex 专属技能栈。从用 /office-hours 起手,到 /plan-ceo-review、/plan-eng-review、/qa 及 /ship。你等于在本地瞬间拉起了一支包含 CEO、主架构师、测试专员在内的微缩全栈团队。
只有深刻理解了 AI 思考树中赖以为生的一些深水区概念,例如"自我反思纠错机制(Reflection)"、"跨工具编排打通树(Tool Use Orchestration)" 以及"任务流分化切分",你写出来的 SKILL.md 或者串联的长线命令才可能产生无坚不摧的核爆威力。
👉 官方精品网课直达:Anthropic Training: Claude 101 (https://anthropic.skilljar.com/claude-101)
👉 极客高赞万贯科普:X 社区 @HiTw93 对 Agentic 的硬核图文解读 (https://x.com/HiTw93/status/2034627967926825175)
AI 是效率的广角放大镜,更是终极车祸现场的放大镜。
真实血泪惨案警示录:
但要防止你的外挂兵团在复杂业务中反噬自身、脱轨崩溃,你必须在这看似无所不能的银弹面前死守两条软件工程与权限管控的核心底线:
千万别指望将一整套连带着三四个耦合模块的复杂生命周期系统一次性丢进 Prompt 企图它能秒出神作——正确的极客玩法是:你扮演一位严苛的主架构师,将主线大需求解耦拆分为颗粒度极小的单一接口模块或业务原子组件。让各种 Agent 一次只集中兵力攻克一个极小的碉堡阵地,步步为营,再做拼装。
AI 能在十秒钟内洋洋洒洒生成几百行"看起来极度合理但不工作"的骗人代码。要拴住这批野马,最顶级的降服术是对自己项目的接口与逻辑树负责:你必须在大模型开搞主线实现重构前,要求并带领它先一步步写出完善稳固的接口测试(Interface Tests)和场景集成测试(Integration Tests)! 测试脚本和参数边界,就是约束大模型的物理防护栏。
只要守住这两点,那些对大型应用架构的选型远瞻、对业务链路脱水的深刻定调,以及严谨的 Code Review 复核判断力,将在这股浪潮中永远成为你被武器武装后最不可替代的核动力护城河。