Oh My OpenCode实战指南：打造你的AgentTeam

关注公众号【寒江瞭望】获取更多内容。资深架构师，AI赛道的躬身入局者，研究AI生产力工具，同时也追踪产业趋势和景气度。这个公众号记录我的双重观察:作为从业者，关注AI如何真正提高了生产力；作为投资者，关注哪些产业趋势正在形成。

[!tip] 核心理念
Oh My OpenCode 是一个多模型智能体编排系统，将单一AI助手转变为真正的协作开发团队。不锁定Claude，不锁定OpenAI，只追求更好的结果、更低的成本、真正的编排。

📋 目录

架构概览
智能体角色与模型匹配
编排系统详解
工作模式实战
配置与最佳实践

🏗️ 架构概览

核心哲学：打破锁定

Oh My OpenCode 不是"Claude Code增强版"，而是要打破单一模型、单一供应商的桎梏：

Anthropic想锁定你，OpenAI想锁定你。Oh My OpenCode不玩这个游戏。

核心优势：

多模型编排 - Claude做编排，GPT做深度推理，Gemini做前端，Haiku做快速任务
并行执行 - 同时启动5+个智能体，研究、实现、验证同步进行
意图门控 - 先理解你真正想要什么，再路由到合适的智能体
哈希锚定编辑 - LINE#ID内容哈希验证，Grok Code Fast 1成功率从6.7%提升到68.3%
技能嵌入MCP - 每个技能自带MCP服务器，上下文窗口保持清爽

数字化开发团队三层架构

┌─────────────────────────────────────────────────────────┐
│  Planning Layer (规划层)                                 │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐              │
│  │Prometheus│  │  Metis   │  │  Momus   │              │
│  │  战略规划 │  │  顾问    │  │  审查者  │              │
│  └──────────┘  └──────────┘  └──────────┘              │
└─────────────────────────────────────────────────────────┘
                         ↓
┌─────────────────────────────────────────────────────────┐
│  Execution Layer (执行层)                                │
│  ┌──────────┐                                            │
│  │  Atlas   │  ← 指挥官，不写代码，只做协调               │
│  │  指挥官  │                                            │
│  └──────────┘                                            │
└─────────────────────────────────────────────────────────┘
                         ↓
┌─────────────────────────────────────────────────────────┐
│  Worker Layer (工作者层)                                 │
│  ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐  │
│  │Sisyphus  │ │  Oracle  │ │ Explore  │ │Librarian │  │
│  │ -Junior  │ │ 架构师   │ │ 代码搜索 │ │ 文档搜索 │  │
│  └──────────┘ └──────────┘ └──────────┘ └──────────┘  │
│  ┌──────────┐ ┌──────────┐                            │
│  │ Frontend │ │Hephaestus│                            │
│  │ UI专家   │ │ 深度工匠 │                            │
│  └──────────┘ └──────────┘                            │
└─────────────────────────────────────────────────────────┘

工作流程

用户请求
   ↓
[意图门控] — 分类你真正想要什么
   ↓
[Sisyphus] — 主编排器，规划和委派
   ↓
   ├─→ [Prometheus] — 战略规划（面试模式）
   ├─→ [Atlas] — Todo编排和执行
   ├─→ [Oracle] — 架构咨询
   ├─→ [Librarian] — 文档/代码搜索
   ├─→ [Explore] — 快速代码库grep
   └─→ [基于类别的智能体] — 按任务类型专业化

🤖 智能体角色与模型匹配

模型家族分类

[!important] 理解模型行为差异
不同模型有不同的"性格"和指令遵循方式。了解哪些模型"相似"有助于做出安全替换。

Claude类模型（指令遵循、结构化输出）

这些模型响应类似Claude，与oh-my-opencode的Claude优化提示词配合良好：

模型	提供商	说明
Claude Opus 4.6	anthropic, github-copilot, opencode	最佳整体体验。Sisyphus默认
Claude Sonnet 4.6	anthropic, github-copilot, opencode	更快更便宜，平衡性好
Claude Haiku 4.5	anthropic, opencode	快速便宜，适合快速任务
Kimi K2.5	kimi-for-coding	行为非常类似Claude，全能型。Atlas默认
GLM 5	zai-coding-plan, opencode	Claude类行为，适合广泛任务

GPT模型（显式推理、原则驱动）

GPT模型需要不同结构的提示词。某些智能体会自动检测GPT并切换提示：

模型	提供商	说明
GPT-5.3-codex	openai, github-copilot, opencode	深度编码引擎。Hephaestus必需
GPT-5.2	openai, github-copilot, opencode	高智能。Oracle默认
GPT-5-Nano	opencode	超便宜快速，简单实用任务

不同行为模型

这些模型有独特特性 — 不要假设它们表现得像Claude或GPT：

模型	提供商	说明
Gemini 3 Pro	google, github-copilot, opencode	擅长视觉/前端任务，不同推理风格
Gemini 3 Flash	google, github-copilot, opencode	快速，适合文档搜索和轻量任务
MiniMax M2.5	venice	快速聪明，实用任务

智能体体系介绍

Sisyphus：纪律之使

以西西弗斯命名。每天推石头上山。从不停止。从不放弃。

角色定位：主编排器。规划、委派给专家、通过激进并行执行推动任务完成。不会中途停下。不会分心。完成任务。

推荐模型：

Sisyphus:
  - Claude Opus 4.6      # 最佳
  - Kimi K2.5            # Claude类替代
  - GLM 5                # 可选项

[!warning] 关键限制
Sisyphus是Claude优化智能体。没有GPT提示词存在。不要用GPT替换，性能会严重下降。

Prometheus：战略规划师

像真正的工程师一样面试你。提出澄清问题。识别范围和歧义。在写一行代码之前构建详细计划。

触发方式：

按Tab进入Prometheus模式
从Sisyphus输入@plan "你的任务"

面试流程：

描述工作 → 采访研究 → 启动explore/librarian → 收集上下文
   ↓
要求检查
   ↓
核心目标定义？ → 否 → 回到采访
范围边界确立？ → 是
关键技术决策？
测试策略确认？
   ↓
计划生成 → Metis咨询（必须） → 写计划 → 用户确认
   ↓
用户想要高准确度？ → 是 → Momus循环验证
                      → 否 → 完成

意图特定策略：

意图	Prometheus焦点	示例问题
重构	安全性 - 行为保持	"什么测试验证当前行为？""回滚策略？"
从头构建	发现 - 优先模式	"在代码库中发现模式X。遵循还是偏离？"
中等任务	防护栏 - 精确边界	"什么绝不能包含？硬约束？"
架构	战略 - 长期影响	"预期寿命？扩展需求？"

Atlas：指挥官

执行Prometheus计划。将任务分发给专业子智能体。跨任务积累学习。独立验证完成。

指挥官心态：Atlas不演奏乐器，它确保完美和声。

能做的事：

读取文件理解上下文
运行命令验证结果
使用lsp_diagnostics检查错误
用grep/glob/ast-grep搜索模式

必须委派的事：

写或编辑代码文件
修复bug
创建测试
Git提交

智慧积累机制：

.sisyphus/notepads/{plan-name}/
├── learnings.md      # 模式、约定、成功方法
├── decisions.md      # 架构选择和理由
├── issues.md         # 问题、阻塞、坑
├── verification.md   # 测试结果、验证结果
└── problems.md       # 未解决问题、技术债

每个任务后提取学习，分类传递给所有后续子智能体。防止重复错误。

Hephaestus：合法工匠

有意反讽的命名。Anthropic因为这个项目阻止OpenCode使用他们的API。团队反而构建了一个自主GPT原生智能体。

运行模型：GPT-5.3 Codex (medium)

使用场景：

需要深度架构推理
- "设计新插件系统"
- "将单体重构为微服务"
需要复杂调试的推理链
- "为什么这个竞态只在周二发生？"
- "通过15个文件追踪内存泄漏"
跨领域知识综合
- "将Rust核心与TypeScript前端集成"
- "零停机MongoDB到PostgreSQL迁移"
你特别想要GPT-5.3 Codex推理

Oracle：顾问

只读高智商顾问，用于架构决策和复杂调试。咨询Oracle当面对不熟悉模式、安全关注或多系统权衡。

辅助角色

智能体	角色	默认模型
Metis	缺口分析员	Claude Opus 4.6
Momus	无情审查员	GPT-5.2
Explore	快速代码库grep	Grok Code Fast
Librarian	文档/OSS搜索	GLM-4.7
Multimodal Looker	视觉/截图分析	Kimi K2.5
Sisyphus-Junior	任务执行器	Claude Sonnet 4.6

类别+技能系统

为什么类别是革命性的

问题：模型名称创造分布偏差

// 旧方式：模型名称
task(agent="gpt-5.2", prompt="...")  // 模型知道自己的局限
task(agent="claude-opus-4.6", prompt="...")  // 不同自我认知

解决方案：语义类别

// 新方式：类别描述意图，非实现
task(category="ultrabrain", prompt="...")     // "战略思考"
task(category="visual-engineering", prompt="...")  // "设计美丽"
task(category="quick", prompt="...")          // "快速完成"

内置类别

类别	模型	何时使用
`visual-engineering`	Gemini 3 Pro	前端、UI/UX、设计、样式、动画
`ultrabrain`	GPT-5.3 Codex (xhigh)	深度逻辑推理、复杂架构决策
`artistry`	Gemini 3 Pro (max)	高度创意或艺术任务、新颖想法
`quick`	Claude Haiku 4.5	琐碎任务 - 单文件更改、拼写错误修复
`deep`	GPT-5.3 Codex (medium)	目标导向自主问题解决、彻底研究
`unspecified-low`	Claude Sonnet 4.6	不适合其他类别的任务，低精力
`unspecified-high`	Claude Opus 4.6 (max)	不适合其他类别的任务，高精力
`writing`	K2P5 (Kimi)	文档、散文、技术写作

安全vs危险覆盖

[!danger] 警告
某些覆盖会严重破坏智能体性能

安全的覆盖（同家族）：

Sisyphus: Opus → Sonnet, Kimi K2.5, GLM 5
Prometheus: Opus → GPT-5.2 (自动切换提示词)
Atlas: Kimi K2.5 → Sonnet, GPT-5.2 (自动切换)

危险的覆盖（无提示词支持）：

❌ Sisyphus → GPT: 无GPT提示词，性能严重下降
❌ Hephaestus → Claude: 为Codex构建，Claude无法复制
❌ Explore → Opus: 巨大成本浪费。Explore需要速度，不需要智能
❌ Librarian → Opus: 同样。文档搜索不需要Opus级推理

🎼 编排系统详解

何时使用什么

复杂度	方法	何时使用
简单	直接提示	简单任务、快速修复、单文件更改
复杂+懒惰	输入`ulw`或`ultrawork`	复杂任务但解释上下文很烦。让智能体自己搞定。
复杂+精确	`@plan` → `/start-work`	精确、多步骤工作需要真正编排。Prometheus规划，Atlas执行。

决策流程：

是快速修复或简单任务？
  └─ 是 → 正常提示
  └─ 否 → 解释完整上下文很烦？
              └─ 是 → 输入"ulw"让智能体搞定
              └─ 否 → 需要精确可验证的执行？
                         └─ 是 → 用@plan给Prometheus规划，然后/start-work
                         └─ 否 → 就用"ulw"

规划层：Prometheus + Metis + Momus

Metis：缺口分析员

Prometheus写计划前，Metis抓住Prometheus漏掉的：

用户请求中的隐藏意图
可能破坏实施的歧义
AI-slop模式（过度工程、范围蔓延）
缺失的验收标准
未处理的边界情况

为什么Metis存在：
计划作者（Prometheus）有"ADHD工作记忆" - 它建立连接但从未写下来。Metis强制外化隐含知识。

Momus：无情审查员

对于高准确度模式，Momus根据四个核心标准验证计划：

清晰度：每个任务是否指定在哪里找到实现细节？
验证：验收标准是否具体可测量？
上下文：是否有足够上下文继续进行而无需>10%猜测？
大局：目的、背景和工作流程是否清晰？

Momus循环：
Momus只在以下时说"OKAY"：

100%文件引用已验证
≥80%任务有明确参考来源
≥90%任务有具体验收标准
零任务需要假设业务逻辑
零关键危险信号

如果REJECTED，Prometheus修复问题并重新提交。无最大重试限制。

执行层：Atlas指挥官

工作流程

1. 读取计划
   ↓
2. 分析任务
   ↓
3. 积累智慧
   ↓
4. 委派任务 → 工作者
   ↓          ↘ 结果+学习
5. 验证结果 ←────────┘
   ↓
6. 最终报告

工作者层：Sisyphus-Junior和专家

Sisyphus-Junior：任务执行器

Junior是真正写代码的主力。关键特性：

专注：不能委派（blocked from task tool）
纪律：强迫性todo跟踪
验证：完成前必须通过lsp_diagnostics
约束：不能修改计划文件（READ-ONLY）

为什么Sonnet足够：
Junior不需要最聪明 - 需要可靠。有：

Atlas的详细提示（50-200行）
传递的积累智慧
清晰的必须做/绝不做约束
验证要求

即使中等模型也能精确执行。智能在系统中，不在单个智能体中。

系统提醒机制

钩子系统确保Junior从不会中途停止：

[SYSTEM REMINDER - TODO CONTINUATION]

你有未完成的todo！完成所有后再响应：
- [ ] 实现用户服务 ← 进行中
- [ ] 添加验证
- [ ] 编写测试

在所有todo标记完成前不要响应。

这个"推石头"机制是系统以Sisyphus命名的原因。

🚀 工作模式实战

Ultrawork模式：懒惰模式

输入ultrawork或就ulw。就这样。

智能体自己搞定一切 - 探索代码库、研究模式、实现功能、用诊断验证。持续工作直到完成。

这是"就去做"模式。全自动。你不需要深度思考，因为智能体替你深度思考。

使用场景：

你想让智能体自己搞清楚
- ulw 修复失败的测试
- ulw 给API添加输入验证
复杂但范围明确的任务
- ulw 按照我们的模式实现JWT认证
- ulw 创建新的部署CLI命令
你感到懒惰（官方支持的使用案例）
- 不想写详细需求
- 信任智能体探索和决策
你想利用现有计划
- 如果存在Prometheus计划，ulw模式可以使用
- 没有计划则回退到自主探索

Prometheus模式：精确模式

按Tab进入Prometheus模式。

Prometheus像真正的工程师一样面试你。提出澄清问题。识别范围和歧义。在写一行代码之前构建详细计划。

然后运行/start-work，Atlas接管。任务分发到专业子智能体。每个完成独立验证。学习跨任务积累。进度跨会话跟踪。

使用场景：

多天项目
关键生产更改
复杂重构
想要文档化的决策轨迹

Hephaestus vs Sisyphus + ultrawork

方面	Hephaestus	Sisyphus + `ulw` / `ultrawork`
模型	GPT-5.3 Codex (medium)	Claude Opus 4.6 (你的默认)
方法	自主深度工作者	关键词激活的ultrawork模式
最适合	复杂架构工作、深度推理	一般复杂任务，"就去做"场景
规划	执行期间自规划	如果可用使用Prometheus计划
委派	重度使用explore/librarian	使用基于类别的委派
温度	0.1	0.1

/start-work行为与会话连续性

运行/start-work时发生什么：

User: /start-work
    ↓
[start-work hook激活]
    ↓
检查：.sisyphus/boulder.json存在吗？
    ↓
    ├─ 是（现有工作）→ 恢复模式
    │   - 读取现有boulder状态
    │   - 计算进度（已检查 vs 未检查复选框）
    │   - 注入剩余任务的继续提示
    │   - Atlas从你离开的地方继续
    │
    └─ 否（全新开始）→ 初始化模式
        - 找.sisyphus/plans/中最新的计划
        - 创建新boulder.json跟踪此计划
        - 切换会话智能体到Atlas
        - 从任务1开始执行

会话连续性示例：

周一上午9:00
  └─ @plan "构建用户认证"
  └─ Prometheus采访并创建计划
  └─ User: /start-work
  └─ Atlas开始执行，创建boulder.json
  └─ 任务1完成，任务2进行中...
  └─ [会话结束 - 电脑崩溃，用户登出等]

周一下午2:00（新会话）
  └─ 用户打开新会话（默认智能体=Sisyphus）
  └─ User: /start-work
  └─ [start-work hook读取boulder.json]
  └─ "恢复'构建用户认证' - 8个任务中完成3个"
  └─ Atlas从任务3继续（无上下文丢失）

运行/start-work时自动激活Atlas。你不需要手动切换到Atlas。

boulder.json跟踪：

active_plan: 当前计划文件路径
session_ids: 所有在此计划上工作的会话
started_at: 工作何时开始
plan_name: 人类可读的计划标识符

⚙️ 配置与最佳实践

提供商优先级

Native (anthropic/, openai/, google/) > Kimi for Coding > GitHub Copilot > Venice > OpenCode Zen > Z.ai Coding Plan

自定义配置

在oh-my-opencode.json中覆盖：

{
  "agents": {
    "sisyphus": {
      "model": "claude-opus-4.6",
      "provider": "anthropic",
      "temperature": 0.1,
      "fallback_chain": [
        {"model": "kimi-k2-5", "provider": "kimi-for-coding"},
        {"model": "glm-5", "provider": "zai-coding-plan"}
      ]
    }
  },
  "categories": {
    "visual-engineering": {
      "model": "gemini-3-pro",
      "provider": "google"
    },
    "ultrabrain": {
      "model": "gpt-5.3-codex",
      "provider": "openai"
    }
  }
}

选择优先级

Claude优化智能体选择模型时：

Claude (Opus/Sonnet) > GPT (如果智能体有双重提示) > Claude类 (Kimi K2.5, GLM 5)

GPT原生智能体选择模型时：

GPT (5.3-codex, 5.2) > Claude Opus (不错回退) > Gemini (可接受)

最佳实践总结

简单任务：直接提示，不使用智能体
复杂但懒：ulw让Sisyphus自主处理
复杂且精确：@plan → Prometheus规划 → /start-work → Atlas执行
深度架构：切换到Hephaestus
前端/视觉：使用visual-engineering类别自动路由到Gemini
快速搜索：Explore和Librarian自动使用快速模型

故障排除

"我切换到Prometheus但什么都没发生"

Prometheus默认进入面试模式。它会问你关于需求的问题。回答它们，准备好时说"make it a plan"。

"/start-work说'找不到活动计划'"

要么：

.sisyphus/plans/中不存在计划 → 先用Prometheus创建一个
计划存在但boulder.json指向别处 → 删除.sisyphus/boulder.json并重试

"我在Atlas但想切换回正常模式"

输入exit或开始新会话。Atlas主要通过/start-work进入 - 你通常不手动"切换到Atlas"。

"@plan和直接切换到Prometheus有什么区别？"

功能上没有区别。 都调用Prometheus。@plan是便利命令，切换智能体是显式控制。用哪个感觉自然就用哪个。

"应该用Hephaestus还是输入ulw？"

大多数任务：在Sisyphus中输入ulw。

用Hephaestus当：你特别需要GPT-5.3 Codex推理风格进行深度架构工作或复杂调试。

💡 核心要点

[!success] 记住这些

智能体专业化 - 不同智能体做不同的事，协作而非单打独斗

类别优先于模型名 - 描述意图，让系统路由到最佳模型

规划与执行分离 - Prometheus规划，Atlas执行，工作者写代码

智慧积累 - 学习传递，错误不重复

会话连续 - boulder.json跟踪进度，随时恢复

多模型协作 - Claude、GPT、Gemini各司其职

Oh My OpenCode实战指南：打造你的AgentTeam

Oh My OpenCode实战指南：打造你的AgentTeam

📋 目录

🏗️ 架构概览

核心哲学：打破锁定

数字化开发团队三层架构

工作流程

🤖 智能体角色与模型匹配

模型家族分类

Claude类模型（指令遵循、结构化输出）

GPT模型（显式推理、原则驱动）

不同行为模型

智能体体系介绍

Sisyphus：纪律之使

Prometheus：战略规划师

Atlas：指挥官

Hephaestus：合法工匠

Oracle：顾问

辅助角色

类别+技能系统

为什么类别是革命性的

内置类别

安全vs危险覆盖

🎼 编排系统详解

何时使用什么

规划层：Prometheus + Metis + Momus

Metis：缺口分析员

Momus：无情审查员

执行层：Atlas指挥官

工作流程

工作者层：Sisyphus-Junior和专家

Sisyphus-Junior：任务执行器

系统提醒机制

🚀 工作模式实战

Ultrawork模式：懒惰模式

Prometheus模式：精确模式

Hephaestus vs Sisyphus + ultrawork

/start-work行为与会话连续性

⚙️ 配置与最佳实践

提供商优先级

自定义配置

选择优先级

最佳实践总结

故障排除

"我切换到Prometheus但什么都没发生"

"/start-work说'找不到活动计划'"

"我在Atlas但想切换回正常模式"

"@plan和直接切换到Prometheus有什么区别？"

"应该用Hephaestus还是输入ulw？"

💡 核心要点

阿里云百炼

热门文章

最新文章

相关电子书