我让 OpenClaw 读完了Claude Code的源码后发现了这些省钱的秘密

2026-04-02 367

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 3月31日Claude Code源码意外泄露，经分析发现其本质是精密Token经济系统。本文分享7大省钱技巧：/compact免费本地压缩、禁用6倍价Fast Mode、善用廉价读缓存、手动设压缩阈值、避免重复Web搜索、默认选低价Sonnet模型、巧用Session Memory等，帮助降低成本。

3 月 31 日，Claude Code 源码通过 npm source map 意外泄露。让 OpenClaw 花了一晚上读完 51 万行代码，让他总结出了这些帮你省钱的秘密。

先说结论

Claude Code 不是简单的「套壳 CLI」，它是一个精心设计的 Token 经济系统。

在 512,000 行源码里，我发现了至少 7 个直接帮你省钱的设计，还有一些……嗯，Anthropic 不想让你知道的定价秘密。

—

`/compact`不是可选功能，是救命稻草

源码位置：src/commands/compact/compact.ts

很多人把 /compact当成「整理对话」的可选功能，错了。

真相：这是防止你 Token 爆炸的最后一道防线。

// compact.ts 核心逻辑
export const call: LocalCommandCall = async (args, context) => {
  // 先尝试 Session Memory 压缩（免费）
  if (!customInstructions) {
    const sessionMemoryResult = await trySessionMemoryCompaction(...)
    if (sessionMemoryResult) {
      return { type: 'compact', ... }
    }
  }
  // 再执行 microcompact（微压缩，几乎不花钱）
  const microcompactResult = await microcompactMessages(messages, context)
  // 最后才调用完整的 compactConversation（花钱）
  const result = await compactConversation(...)
}

省钱策略：

不带参数的 /compact优先用 Session Memory—— 这是免费的本地压缩，不消耗 API 调用
microcompact 先执行—— 它只删除冗余消息，不调用 LLM
真正的总结压缩只在必要时触发

我的建议：看到上下文超过 100K tokens 就手动 /compact，别等自动触发。自动触发的阈值是 contextWindow - 13,000，那时候你已经花了不少冤枉钱了。

—

Fast Mode 的定价陷阱

源码位置：src/utils/modelCost.ts+ src/utils/fastMode.ts

这是最劲爆的发现。

Opus 4.6 有两种价格：


// 普通模式：$5 输入 / $25 输出 per Mtok
export const COST_TIER_5_25 = {
  inputTokens: 5,
  outputTokens: 25,
  ...
}
// Fast Mode：$30 输入 / $150 输出 per Mtok
export const COST_TIER_30_150 = {
  inputTokens: 30,
  outputTokens: 150,
  ...
}

看到了吗？Fast Mode 贵 6 倍。

但源码里有个细节：

export function getOpus46CostTier(fastMode: boolean): ModelCosts {
  if (isFastModeEnabled() && fastMode) {
    return COST_TIER_30_150  // 6 倍价格
  }
  return COST_TIER_5_25  // 正常价格
}

省钱策略：

除非你真的需要「实时响应」，否则关掉 Fast Mode
检查你的设置：/config里找 fastMode
源码里有个环境变量可以强制关闭：CLAUDE_CODE_DISABLE_FAST_MODE=1

更劲爆的是：Fast Mode 还有「冷却时间」机制。如果你连续触发 rate limit，系统会自动把你踢回普通模式，但不会通知你——你以为是 Fast Mode，其实已经在用普通模式计费了。

—

Cache是你的朋友，但Claude Code不希望你用太多

源码位置：src/cost-tracker.ts

看这段计价代码：

export const COST_TIER_3_15 = {
  inputTokens: 3,      // $3 per Mtok
  outputTokens: 15,    // $15 per Mtok
  promptCacheWriteTokens: 3.75,   // 写缓存 $3.75
  promptCacheReadTokens: 0.3,     // 读缓存 $0.3
  webSearchRequests: 0.01,        // 每次搜索 $0.01
}

发现没有？

写缓存：$3.75/Mtok（比正常输入贵 25%）
读缓存：$0.3/Mtok（只有正常输入的 10%）

省钱策略：

多用读缓存，少写缓存—— 写一次的钱够读 12 次
长对话用 /resume恢复会话—— 避免重新写缓存
避免频繁切换项目—— 每次切换都可能触发新的缓存写入

源码里有个细节：cost-tracker.ts会追踪每个模型的 cacheCreationInputTokens和 cacheReadInputTokens，用 /cost命令可以看到详细账单。

我建议你每次开始工作前先 /cost看看昨天的账单，心里有数。

—

Auto Compact 的「缓冲区间」秘密

源码位置：src/services/compact/autoCompact.ts

这段代码暴露了 Anthropic 的「心理战」：

export const AUTOCOMPACT_BUFFER_TOKENS = 13_000
export const WARNING_THRESHOLD_BUFFER_TOKENS = 20_000
export const ERROR_THRESHOLD_BUFFER_TOKENS = 20_000
export const MANUAL_COMPACT_BUFFER_TOKENS = 3_000
export function getAutoCompactThreshold(model: string): number {
  const effectiveContextWindow = getEffectiveContextWindowSize(model)
  return effectiveContextWindow - AUTOCOMPACT_BUFFER_TOKENS
}

翻译一下：

200K 上下文窗口
自动压缩触发点：187K（200K - 13K）
警告阈值：180K
错误阈值：180K
手动压缩安全线：197K

这意味着什么？

系统在「诱导」你早点压缩。13K 的缓冲区间看似保护你，实则是防止你用到 199K 才压缩——那时候一次 API 调用可能直接失败，钱花了还没结果。

省钱策略：

手动设置更激进的压缩阈值：CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=80（80% 就压缩）
或者用环境变量限制最大上下文：CLAUDE_CODE_MAX_CONTEXT_TOKENS=100000（强制用 100K 而非 200K）

源码里还有个彩蛋：

// 连续自动压缩失败 3 次就放弃
const MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES = 3

连续失败 3 次系统就放弃了——这时候你的对话已经处于「半残」状态，继续聊只会浪费钱。看到自动压缩失败 3 次，立刻手动 /compact或者重启会话。

—

Web Search 每次 $0.01，但你可能在重复付费

源码位置：src/utils/modelCost.ts

webSearchRequests: 0.01,  // 每次搜索 $0.01

看起来不贵？看源码里的追踪逻辑：

export function addToTotalSessionCost(...) {
  // 追踪 web search 请求数
  accumulated.webSearchRequests += usage.webSearchRequests ?? 0
  // 每次请求都计费
  modelUsage.costUSD += cost
}

问题在于：Claude Code 不会缓存搜索结果。你问「今天天气怎么样」，它搜索一次；5 分钟后你问「刚才说的天气」，它可能又搜索一次。

省钱策略：

用 /context查看当前上下文—— 确认信息已经在对话里
避免重复问同一类问题—— 每次都可能触发新搜索
用 @file引用本地文件而不是让 Claude 搜索 —— 文件读取免费

源码里的细节：cost-tracker.ts的 formatModelUsage()会显示 web search次数，用 /cost可以看到。

—

模型选择的「默认陷阱」

源码位置：src/utils/model/model.ts+ src/utils/context.ts

源码里有个函数叫 getDefaultMainLoopModelSetting()，它决定了你默认用什么模型。

但更关键的是这个：

export function getModelMaxOutputTokens(model: string): {
  default: number
  upperLimit: number
} {
  if (m.includes('opus-4-6')) {
    defaultTokens = 64_000
    upperLimit = 128_000
  } else if (m.includes('sonnet-4-6')) {
    defaultTokens = 32_000
    upperLimit = 128_000
  }
  // ...
}

Opus 4.6 默认输出 64K tokens，Sonnet 4.6 默认 32K。

但看定价：

Opus 4.6: 5/5/25 per Mtok
Sonnet 4.6: 3/3/15 per Mtok

Opus 不仅单价贵，默认输出还多一倍。

省钱策略：

默认用 Sonnet 4.6—— 除非你真的需要 Opus 的推理能力
手动限制最大输出：/config maxOutputTokens 16000
用 /brief命令—— 这是源码里的「简短模式」，强制模型少说话

源码里的彩蛋命令：/brief.ts存在于 src/commands/，但文档里从来没提过。我猜是内部测试功能，但可以用。

—

Session Memory 是免费的，但 90% 的人不知道

源码位置：src/services/compact/sessionMemoryCompact.ts

这段代码在 compact.ts里被优先调用：

// 先尝试 session memory compaction（免费）
if (!customInstructions) {
  const sessionMemoryResult = await trySessionMemoryCompaction(
    messages,
    context.agentId,
  )
  if (sessionMemoryResult) {
    return { type: 'compact', ... }  // 直接返回，不调用 API
  }
}

Session Memory 压缩是本地操作，不消耗 API 调用。

但它有个限制：不支持自定义指令。一旦你加了参数（比如 /compact 总结重点），系统就会切换到付费的完整压缩模式。

省钱策略：

日常压缩直接用 /compact（不加参数）—— 走免费通道
只在必要时加自定义指令—— 比如「只总结技术决策」
定期用 /memory查看持久化记忆—— 避免重复信息累积

额外发现：这些命令可能帮你省钱。源码 src/commands/目录里还有一些「隐藏命令」：

命令	作用	省钱指数
`/cost`	查看当前会话花费	⭐⭐⭐⭐⭐
`/compact`	压缩上下文	⭐⭐⭐⭐⭐
`/brief`	简短模式（未文档化）	⭐⭐⭐⭐
`/resume`	恢复之前会话（复用缓存）	⭐⭐⭐⭐
`/context`	查看当前上下文状态	⭐⭐⭐
`/config`	修改配置（限制输出 tokens）	⭐⭐⭐⭐

我建议你每次开始工作前：

/cost          # 看看上次花了多少
/context       # 确认当前状态
/config maxOutputTokens 16000  # 限制输出

最后的思考

读到这些，让我自己我最大的感受是：

Claude Code 的设计者在「Token 经济」上花了大量心思。每一个功能背后都有成本考量，但大部分用户看不到。

几个核心发现：

自动压缩是保护机制，但阈值设置偏保守—— 系统在防止你失败，但也在「诱导」你早点付费压缩
Fast Mode 是「奢侈品」—— 6 倍价格，除非你真需要实时性，否则关掉
缓存是把双刃剑—— 读缓存便宜，写缓存贵，策略很重要
Session Memory 是免费午餐—— 但需要你用对方式

文章标签：

缓存

API

我让 OpenClaw 读完了Claude Code的源码后发现了这些省钱的秘密

先说结论

`/compact`不是可选功能，是救命稻草

Fast Mode 的定价陷阱

Cache是你的朋友，但Claude Code不希望你用太多

Auto Compact 的「缓冲区间」秘密

Web Search 每次 $0.01，但你可能在重复付费

模型选择的「默认陷阱」

Session Memory 是免费的，但 90% 的人不知道

最后的思考

AI原生应用

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

我让 OpenClaw 读完了Claude Code的源码后发现了这些省钱的秘密

先说结论

/compact不是可选功能，是救命稻草

Fast Mode 的定价陷阱

Cache是你的朋友，但Claude Code不希望你用太多

Auto Compact 的「缓冲区间」秘密

Web Search 每次 $0.01，但你可能在重复付费

模型选择的「默认陷阱」

Session Memory 是免费的，但 90% 的人不知道

最后的思考

AI原生应用

热门文章

最新文章

相关电子书

`/compact`不是可选功能，是救命稻草