Claude Code 斜杠命令（五）：模型与推理控制

2026年6月6日 10:40 CST Claude CodeAI工具教程斜杠命令

系列目录

（一）快速入门——最常用的基础命令

（二）对话管理——让你的会话有条不紊

（三）上下文管理——不让 Token 成为瓶颈

（四）代码审查三剑客

（五）模型与推理控制（本文）

（六）并行工作与后台 Agent

（七）项目配置与权限管理

（八）研究、规划与 CI/CD 集成

# 模型与推理控制 ## 切换模型 - /model claude-opus-4-8 最强推理 - /model claude-sonnet-4-6 均衡 - /model claude-haiku-4-5 最快 ## 推理深度 - /effort low 极浅，最快 - /effort medium 日常任务 - /effort high 多文件重构 - /effort xhigh 复杂算法 - /effort max 极深，仅 Opus - /effort ultracode 多 Agent 并行 - /effort auto 自适应 ## 快速模式 - /fast 系统级跳过部分处理 - 适合探索性对话 ## 计划模式 - /plan 只输出计划不执行 - 确认后再退出执行 - 防止大范围误操作

AI 辅助编程最容易踩的坑之一，是用同一套默认设置应对所有任务。写个简单的注释和重构一个复杂的多层架构，背后所需的推理深度相差数十倍。盲目使用高算力会浪费金钱，盲目节省算力会让结果质量下降。Claude Code 提供了一组命令，让你精确控制模型选择和推理深度，在速度与质量之间找到最佳平衡。

/model：选择合适的大脑

/model 命令用于在当前会话中切换底层语言模型。

/model claude-opus-4-8
/model claude-sonnet-4-6
/model claude-haiku-4-5

可选模型一览

模型	模型 ID	定位	适用场景
Claude Opus 4.8	`claude-opus-4-8`	最强推理，高成本	复杂架构设计、深度调试、长程 agent 任务
Claude Sonnet 4.6	`claude-sonnet-4-6`	速度与智能的平衡	日常编码、代码审查、中等复杂任务
Claude Haiku 4.5	`claude-haiku-4-5`	最快响应，低成本	简单补全、格式化、重复性操作

何时换模型

换成 Opus：当你在处理以下任务时——

从零设计一套微服务架构
调试一个跨越多个抽象层的 bug
需要模型对代码做深度语义理解

换成 Haiku：当任务足够简单时——

批量生成 JSDoc 注释
将一批函数名从 camelCase 转为 snake_case
快速回答"这个 API 参数叫什么"

切换命令立即生效，不需要重启会话。

/effort：精确控制推理深度

/effort 是本文的重点。它控制模型在响应前"思考"多少，也直接影响 Token 消耗和响应延迟。

/effort low
/effort medium
/effort high
/effort xhigh
/effort max
/effort ultracode
/effort auto

各级别适用场景对比

级别	推理深度	延迟	Token 消耗	典型场景
`low`	极浅	最快	最少	简单问答、格式转换、单行补全
`medium`	适中	快	较少	日常 bug 修复、写单元测试、代码解释
`high`	深（默认）	适中	适中	多文件重构、API 设计、代码审查
`xhigh`	很深	较慢	较多	复杂算法实现、跨模块依赖分析
`max`	极深（仅 Opus）	慢	多	正确性优先的关键任务，不计成本
`ultracode`	多 Agent 编排	最慢	最多	大规模并行 agent 工作流
`auto`	自适应	不确定	不确定	让模型自行判断所需深度

实际场景举例：

# 写单元测试 — low 就够了
/effort low
"为 parseDate 函数写5个边界测试用例"

# 重构 auth 模块 — high 比较稳妥
/effort high
"将 auth.js 中的 callback 风格全部改为 async/await，保持功能不变"

# 设计新的缓存架构 — max 确保推理充分
/effort max
"设计一套支持多级缓存的系统，需要考虑 Redis、本地内存和 CDN 的协同"

ultracode：多 Agent 工作流编排

ultracode 是一个特殊级别，它会启动多 Agent 并行工作模式。模型不再以单一对话的形式思考，而是将任务拆解成多个子任务，分发给多个并行运行的 agent 分别处理，最后汇总结果。

适用于：

需要同时修改项目中数十个文件的大规模重构
并行运行多组测试并综合分析结果
跨越多个独立模块的代码迁移任务

这个模式延迟高、成本高，但对于真正需要"大规模并行推理"的任务，效果是普通模式无法比拟的。

auto 模式的行为

/effort auto 让模型根据你的提问内容自行判断需要多少推理深度。简单的问题会自动用低 effort，复杂问题会自动加深。

这个模式的缺点是不可预测性较强——你无法提前知道这次请求会花多少时间和 Token。在成本敏感的场景下，建议手动指定级别。

/fast：快速模式开关

/fast 命令开启或关闭"快速模式"（fast mode）。

/fast         # 切换 fast mode（开启/关闭）

Fast mode 不等同于 /effort low。主要区别在于：

/effort low：降低推理深度，但模型仍然在进行完整的思考流程，只是思考步骤更少
/fast：系统级别的优化，跳过部分内部处理步骤，牺牲一定的响应质量换取更快的响应速度

在实践中，/fast 更适合用于"我只需要一个大概的答案，不需要精确"的探索性对话。例如：

/fast
"这个设计模式叫什么名字？"    # 快速确认概念，不需要深度解释
"Python 里怎么读 JSON 文件？"  # 已知的简单问题，快速获得提示

如果你需要精确的代码生成或复杂的技术分析，关闭 fast mode。

/plan：计划模式，防止 AI 直接动手

/plan 开启计划模式（plan mode）。

/plan

计划模式的核心作用：让 Claude 只输出"我打算怎么做"，而不直接执行任何文件操作或代码修改。

这是一个重要的安全机制。在没有 plan mode 的情况下，一个含糊的需求可能导致 AI 直接开始修改文件——而你并不确认它理解了你的意图。启用 plan mode 后，Claude 会先呈现完整的执行计划，等你确认再继续。

典型工作流：

/plan
"帮我把项目从 CommonJS 迁移到 ESM"

# Claude 输出：
# 1. 修改 package.json，添加 "type": "module"
# 2. 将所有 require() 改为 import
# 3. 将 module.exports 改为 export default / export
# 4. 更新 Jest 配置以支持 ESM
# 5. 检查所有动态 require() 调用...

# 你确认计划 → 退出 plan mode → Claude 开始执行

这个模式特别适合：

影响范围大的重构（修改数十个文件）
不可逆操作（删除、重命名、修改配置）
你对 AI 将要做的事情不够确定的时候

flowchart LR A[输入需求] --> B[Claude 输出计划] B --> C{人工确认?} C -->|确认| D[退出 plan mode → 执行] C -->|修改| B

选择策略决策树

graph LR A[任务类型] --> B{需要精确吗?} B -->|不需要| C[/fast + low] B -->|需要| D{任务复杂度} D -->|简单| E[medium] D -->|复杂| F{影响范围} F -->|单模块| G[high] F -->|跨模块/架构| H[xhigh 或 max]

费用影响说明

effort 级别直接影响 Token 消耗，而 Token 是计费的基本单位。

以下是大致的相对消耗比例（实际数值因任务不同而有所差异）：

级别	相对 Token 消耗
`low`	1x
`medium`	2–3x
`high`	4–6x
`xhigh`	8–12x
`max`	15–25x
`ultracode`	50x+

对于高频使用 Claude Code 的团队，合理设置 effort 可以显著降低月度费用。建议的策略是：为常用的任务类型建立默认 effort 规范，而不是每次都使用默认的 high。

常见误区

误区一：默认 high 就是最好的选择

很多人觉得"反正高 effort 结果更好，那就一直用 high"。但对于简单任务，high 不会带来更好的结果——只会让你等更久、花更多钱。写一个 getter 函数，low 和 max 的输出质量几乎没有区别。

误区二：ultracode 就是"更强的 max"

ultracode 不是单纯的更高推理深度，而是完全不同的工作方式（多 Agent 并行）。用 ultracode 回答一个简单问题，结果可能还不如 medium——因为多 Agent 协调本身会引入额外的复杂性。

误区三：plan mode 会拖慢工作效率

初学者常常跳过 plan mode，觉得多一步确认太麻烦。但在实际使用中，一次因为误解需求而导致的大规模回滚，消耗的时间远超过几次 plan mode 确认。在影响范围不明确时，plan mode 是值得的。

掌握这四个命令的组合使用，你就能让 Claude Code 在每个任务上都以合适的代价给出合适质量的答案。下一篇将介绍如何通过并行 Agent 进一步提升开发效率。

实操清单

尝试 /model 切换模型，感受不同模型的响应风格
为简单任务（写注释、格式转换）设置 /effort low
为中等任务（bug 修复、单元测试）使用默认 /effort medium
重要模块重构时使用 /effort high 或 xhigh
大范围修改前执行 /plan 先确认执行计划再放行
探索性对话时开启 /fast 体验加速效果
建立团队内部的 effort 使用规范，降低月度费用