Oh My OpenCode实战指南:打造你的AgentTeam

简介: 《Oh My OpenCode实战指南》介绍多模型智能体编排系统,将AI助手升级为协作开发团队。支持Claude/GPT/Gemini等多模型灵活调度,通过规划层(Prometheus)、执行层(Atlas)与工作者层(Hephaestus等)三层架构,实现意图识别、并行任务委派与知识沉淀。强调“类别优先于模型名”,打破厂商锁定,提升开发效率与可靠性。(239字)

Oh My OpenCode实战指南:打造你的AgentTeam

关注公众号【寒江瞭望】获取更多内容。资深架构师,AI赛道的躬身入局者,研究AI生产力工具,同时也追踪产业趋势和景气度。这个公众号记录我的双重观察:作为从业者,关注AI如何真正提高了生产力;作为投资者,关注哪些产业趋势正在形成。

[!tip] 核心理念
Oh My OpenCode 是一个多模型智能体编排系统,将单一AI助手转变为真正的协作开发团队。不锁定Claude,不锁定OpenAI,只追求更好的结果、更低的成本、真正的编排。

📋 目录


🏗️ 架构概览

核心哲学:打破锁定

Oh My OpenCode 不是"Claude Code增强版",而是要打破单一模型、单一供应商的桎梏:

Anthropic想锁定你,OpenAI想锁定你。Oh My OpenCode不玩这个游戏。

核心优势

  • 多模型编排 - Claude做编排,GPT做深度推理,Gemini做前端,Haiku做快速任务
  • 并行执行 - 同时启动5+个智能体,研究、实现、验证同步进行
  • 意图门控 - 先理解你真正想要什么,再路由到合适的智能体
  • 哈希锚定编辑 - LINE#ID内容哈希验证,Grok Code Fast 1成功率从6.7%提升到68.3%
  • 技能嵌入MCP - 每个技能自带MCP服务器,上下文窗口保持清爽

数字化开发团队三层架构

image.png

┌─────────────────────────────────────────────────────────┐
│  Planning Layer (规划层)                                 │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐              │
│  │Prometheus│  │  Metis   │  │  Momus   │              │
│  │  战略规划 │  │  顾问    │  │  审查者  │              │
│  └──────────┘  └──────────┘  └──────────┘              │
└─────────────────────────────────────────────────────────┘
                         ↓
┌─────────────────────────────────────────────────────────┐
│  Execution Layer (执行层)                                │
│  ┌──────────┐                                            │
│  │  Atlas   │  ← 指挥官,不写代码,只做协调               │
│  │  指挥官  │                                            │
│  └──────────┘                                            │
└─────────────────────────────────────────────────────────┘
                         ↓
┌─────────────────────────────────────────────────────────┐
│  Worker Layer (工作者层)                                 │
│  ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐  │
│  │Sisyphus  │ │  Oracle  │ │ Explore  │ │Librarian │  │
│  │ -Junior  │ │ 架构师   │ │ 代码搜索 │ │ 文档搜索 │  │
│  └──────────┘ └──────────┘ └──────────┘ └──────────┘  │
│  ┌──────────┐ ┌──────────┐                            │
│  │ Frontend │ │Hephaestus│                            │
│  │ UI专家   │ │ 深度工匠 │                            │
│  └──────────┘ └──────────┘                            │
└─────────────────────────────────────────────────────────┘

工作流程

用户请求
   ↓
[意图门控] — 分类你真正想要什么
   ↓
[Sisyphus] — 主编排器,规划和委派
   ↓
   ├─→ [Prometheus] — 战略规划(面试模式)
   ├─→ [Atlas] — Todo编排和执行
   ├─→ [Oracle] — 架构咨询
   ├─→ [Librarian] — 文档/代码搜索
   ├─→ [Explore] — 快速代码库grep
   └─→ [基于类别的智能体] — 按任务类型专业化

🤖 智能体角色与模型匹配

模型家族分类

[!important] 理解模型行为差异
不同模型有不同的"性格"和指令遵循方式。了解哪些模型"相似"有助于做出安全替换。

Claude类模型(指令遵循、结构化输出)

这些模型响应类似Claude,与oh-my-opencode的Claude优化提示词配合良好:

模型 提供商 说明
Claude Opus 4.6 anthropic, github-copilot, opencode 最佳整体体验。Sisyphus默认
Claude Sonnet 4.6 anthropic, github-copilot, opencode 更快更便宜,平衡性好
Claude Haiku 4.5 anthropic, opencode 快速便宜,适合快速任务
Kimi K2.5 kimi-for-coding 行为非常类似Claude,全能型。Atlas默认
GLM 5 zai-coding-plan, opencode Claude类行为,适合广泛任务

GPT模型(显式推理、原则驱动)

GPT模型需要不同结构的提示词。某些智能体会自动检测GPT并切换提示:

模型 提供商 说明
GPT-5.3-codex openai, github-copilot, opencode 深度编码引擎。Hephaestus必需
GPT-5.2 openai, github-copilot, opencode 高智能。Oracle默认
GPT-5-Nano opencode 超便宜快速,简单实用任务

不同行为模型

这些模型有独特特性 — 不要假设它们表现得像Claude或GPT:

模型 提供商 说明
Gemini 3 Pro google, github-copilot, opencode 擅长视觉/前端任务,不同推理风格
Gemini 3 Flash google, github-copilot, opencode 快速,适合文档搜索和轻量任务
MiniMax M2.5 venice 快速聪明,实用任务

智能体体系介绍

image.png

Sisyphus:纪律之使

以西西弗斯命名。每天推石头上山。从不停止。从不放弃。

角色定位:主编排器。规划、委派给专家、通过激进并行执行推动任务完成。不会中途停下。不会分心。完成任务。

推荐模型

Sisyphus:
  - Claude Opus 4.6      # 最佳
  - Kimi K2.5            # Claude类替代
  - GLM 5                # 可选项

[!warning] 关键限制
Sisyphus是Claude优化智能体。没有GPT提示词存在。不要用GPT替换,性能会严重下降。

Prometheus:战略规划师

像真正的工程师一样面试你。提出澄清问题。识别范围和歧义。在写一行代码之前构建详细计划。

触发方式

  1. Tab进入Prometheus模式
  2. 从Sisyphus输入@plan "你的任务"

面试流程

描述工作 → 采访研究 → 启动explore/librarian → 收集上下文
   ↓
要求检查
   ↓
核心目标定义? → 否 → 回到采访
范围边界确立? → 是
关键技术决策?
测试策略确认?
   ↓
计划生成 → Metis咨询(必须) → 写计划 → 用户确认
   ↓
用户想要高准确度? → 是 → Momus循环验证
                      → 否 → 完成

意图特定策略

意图 Prometheus焦点 示例问题
重构 安全性 - 行为保持 "什么测试验证当前行为?""回滚策略?"
从头构建 发现 - 优先模式 "在代码库中发现模式X。遵循还是偏离?"
中等任务 防护栏 - 精确边界 "什么绝不能包含?硬约束?"
架构 战略 - 长期影响 "预期寿命?扩展需求?"

Atlas:指挥官

执行Prometheus计划。将任务分发给专业子智能体。跨任务积累学习。独立验证完成。

指挥官心态:Atlas不演奏乐器,它确保完美和声。

能做的事

  • 读取文件理解上下文
  • 运行命令验证结果
  • 使用lsp_diagnostics检查错误
  • 用grep/glob/ast-grep搜索模式

必须委派的事

  • 写或编辑代码文件
  • 修复bug
  • 创建测试
  • Git提交

智慧积累机制

.sisyphus/notepads/{plan-name}/
├── learnings.md      # 模式、约定、成功方法
├── decisions.md      # 架构选择和理由
├── issues.md         # 问题、阻塞、坑
├── verification.md   # 测试结果、验证结果
└── problems.md       # 未解决问题、技术债

每个任务后提取学习,分类传递给所有后续子智能体。防止重复错误。

Hephaestus:合法工匠

有意反讽的命名。Anthropic因为这个项目阻止OpenCode使用他们的API。团队反而构建了一个自主GPT原生智能体。

运行模型:GPT-5.3 Codex (medium)

使用场景

  1. 需要深度架构推理

    • "设计新插件系统"
    • "将单体重构为微服务"
  2. 需要复杂调试的推理链

    • "为什么这个竞态只在周二发生?"
    • "通过15个文件追踪内存泄漏"
  3. 跨领域知识综合

    • "将Rust核心与TypeScript前端集成"
    • "零停机MongoDB到PostgreSQL迁移"
  4. 你特别想要GPT-5.3 Codex推理

Oracle:顾问

只读高智商顾问,用于架构决策和复杂调试。咨询Oracle当面对不熟悉模式、安全关注或多系统权衡。

辅助角色

智能体 角色 默认模型
Metis 缺口分析员 Claude Opus 4.6
Momus 无情审查员 GPT-5.2
Explore 快速代码库grep Grok Code Fast
Librarian 文档/OSS搜索 GLM-4.7
Multimodal Looker 视觉/截图分析 Kimi K2.5
Sisyphus-Junior 任务执行器 Claude Sonnet 4.6

类别+技能系统

为什么类别是革命性的

问题:模型名称创造分布偏差

// 旧方式:模型名称
task(agent="gpt-5.2", prompt="...")  // 模型知道自己的局限
task(agent="claude-opus-4.6", prompt="...")  // 不同自我认知

解决方案:语义类别

// 新方式:类别描述意图,非实现
task(category="ultrabrain", prompt="...")     // "战略思考"
task(category="visual-engineering", prompt="...")  // "设计美丽"
task(category="quick", prompt="...")          // "快速完成"

内置类别

类别 模型 何时使用
visual-engineering Gemini 3 Pro 前端、UI/UX、设计、样式、动画
ultrabrain GPT-5.3 Codex (xhigh) 深度逻辑推理、复杂架构决策
artistry Gemini 3 Pro (max) 高度创意或艺术任务、新颖想法
quick Claude Haiku 4.5 琐碎任务 - 单文件更改、拼写错误修复
deep GPT-5.3 Codex (medium) 目标导向自主问题解决、彻底研究
unspecified-low Claude Sonnet 4.6 不适合其他类别的任务,低精力
unspecified-high Claude Opus 4.6 (max) 不适合其他类别的任务,高精力
writing K2P5 (Kimi) 文档、散文、技术写作

安全vs危险覆盖

[!danger] 警告

某些覆盖会严重破坏智能体性能

安全的覆盖(同家族):

  • Sisyphus: Opus → Sonnet, Kimi K2.5, GLM 5
  • Prometheus: Opus → GPT-5.2 (自动切换提示词)
  • Atlas: Kimi K2.5 → Sonnet, GPT-5.2 (自动切换)

危险的覆盖(无提示词支持):

  • ❌ Sisyphus → GPT: 无GPT提示词,性能严重下降
  • ❌ Hephaestus → Claude: 为Codex构建,Claude无法复制
  • ❌ Explore → Opus: 巨大成本浪费。Explore需要速度,不需要智能
  • ❌ Librarian → Opus: 同样。文档搜索不需要Opus级推理

🎼 编排系统详解

何时使用什么

复杂度 方法 何时使用
简单 直接提示 简单任务、快速修复、单文件更改
复杂+懒惰 输入ulwultrawork 复杂任务但解释上下文很烦。让智能体自己搞定。
复杂+精确 @plan/start-work 精确、多步骤工作需要真正编排。Prometheus规划,Atlas执行。

决策流程

是快速修复或简单任务?
  └─ 是 → 正常提示
  └─ 否 → 解释完整上下文很烦?
              └─ 是 → 输入"ulw"让智能体搞定
              └─ 否 → 需要精确可验证的执行?
                         └─ 是 → 用@plan给Prometheus规划,然后/start-work
                         └─ 否 → 就用"ulw"

规划层:Prometheus + Metis + Momus

image.png

Metis:缺口分析员

Prometheus写计划前,Metis抓住Prometheus漏掉的:

  • 用户请求中的隐藏意图
  • 可能破坏实施的歧义
  • AI-slop模式(过度工程、范围蔓延)
  • 缺失的验收标准
  • 未处理的边界情况

为什么Metis存在
计划作者(Prometheus)有"ADHD工作记忆" - 它建立连接但从未写下来。Metis强制外化隐含知识。

Momus:无情审查员

对于高准确度模式,Momus根据四个核心标准验证计划:

  1. 清晰度:每个任务是否指定在哪里找到实现细节?
  2. 验证:验收标准是否具体可测量?
  3. 上下文:是否有足够上下文继续进行而无需>10%猜测?
  4. 大局:目的、背景和工作流程是否清晰?

Momus循环
Momus只在以下时说"OKAY":

  • 100%文件引用已验证
  • ≥80%任务有明确参考来源
  • ≥90%任务有具体验收标准
  • 零任务需要假设业务逻辑
  • 零关键危险信号

如果REJECTED,Prometheus修复问题并重新提交。无最大重试限制。

执行层:Atlas指挥官

工作流程

1. 读取计划
   ↓
2. 分析任务
   ↓
3. 积累智慧
   ↓
4. 委派任务 → 工作者
   ↓          ↘ 结果+学习
5. 验证结果 ←────────┘
   ↓
6. 最终报告

工作者层:Sisyphus-Junior和专家

image.png

Sisyphus-Junior:任务执行器

Junior是真正写代码的主力。关键特性:

  • 专注:不能委派(blocked from task tool)
  • 纪律:强迫性todo跟踪
  • 验证:完成前必须通过lsp_diagnostics
  • 约束:不能修改计划文件(READ-ONLY)

为什么Sonnet足够
Junior不需要最聪明 - 需要可靠。有:

  1. Atlas的详细提示(50-200行)
  2. 传递的积累智慧
  3. 清晰的必须做/绝不做约束
  4. 验证要求

即使中等模型也能精确执行。智能在系统中,不在单个智能体中。

系统提醒机制

钩子系统确保Junior从不会中途停止:

[SYSTEM REMINDER - TODO CONTINUATION]

你有未完成的todo!完成所有后再响应:
- [ ] 实现用户服务 ← 进行中
- [ ] 添加验证
- [ ] 编写测试

在所有todo标记完成前不要响应。

这个"推石头"机制是系统以Sisyphus命名的原因。


🚀 工作模式实战

Ultrawork模式:懒惰模式

image.png

输入ultrawork或就ulw。就这样。

智能体自己搞定一切 - 探索代码库、研究模式、实现功能、用诊断验证。持续工作直到完成。

这是"就去做"模式。全自动。你不需要深度思考,因为智能体替你深度思考。

使用场景

  1. 你想让智能体自己搞清楚

    • ulw 修复失败的测试
    • ulw 给API添加输入验证
  2. 复杂但范围明确的任务

    • ulw 按照我们的模式实现JWT认证
    • ulw 创建新的部署CLI命令
  3. 你感到懒惰(官方支持的使用案例)

    • 不想写详细需求
    • 信任智能体探索和决策
  4. 你想利用现有计划

    • 如果存在Prometheus计划,ulw模式可以使用
    • 没有计划则回退到自主探索

Prometheus模式:精确模式

image.png

Tab进入Prometheus模式。

Prometheus像真正的工程师一样面试你。提出澄清问题。识别范围和歧义。在写一行代码之前构建详细计划。

然后运行/start-work,Atlas接管。任务分发到专业子智能体。每个完成独立验证。学习跨任务积累。进度跨会话跟踪。

使用场景

  • 多天项目
  • 关键生产更改
  • 复杂重构
  • 想要文档化的决策轨迹

Hephaestus vs Sisyphus + ultrawork

方面 Hephaestus Sisyphus + ulw / ultrawork
模型 GPT-5.3 Codex (medium) Claude Opus 4.6 (你的默认)
方法 自主深度工作者 关键词激活的ultrawork模式
最适合 复杂架构工作、深度推理 一般复杂任务,"就去做"场景
规划 执行期间自规划 如果可用使用Prometheus计划
委派 重度使用explore/librarian 使用基于类别的委派
温度 0.1 0.1

推荐

  • 大多数用户:在Sisyphus中使用ulw关键词。这是默认路径,对90%复杂任务效果出色。
  • 高级用户:特别需要GPT-5.3 Codex推理风格或想要完全自主探索和执行的"AmpCode深度模式"体验时切换到Hephaestus。

/start-work行为与会话连续性

image.png

运行/start-work时发生什么

User: /start-work
    ↓
[start-work hook激活]
    ↓
检查:.sisyphus/boulder.json存在吗?
    ↓
    ├─ 是(现有工作)→ 恢复模式
    │   - 读取现有boulder状态
    │   - 计算进度(已检查 vs 未检查复选框)
    │   - 注入剩余任务的继续提示
    │   - Atlas从你离开的地方继续
    │
    └─ 否(全新开始)→ 初始化模式
        - 找.sisyphus/plans/中最新的计划
        - 创建新boulder.json跟踪此计划
        - 切换会话智能体到Atlas
        - 从任务1开始执行

会话连续性示例

周一上午9:00
  └─ @plan "构建用户认证"
  └─ Prometheus采访并创建计划
  └─ User: /start-work
  └─ Atlas开始执行,创建boulder.json
  └─ 任务1完成,任务2进行中...
  └─ [会话结束 - 电脑崩溃,用户登出等]

周一下午2:00(新会话)
  └─ 用户打开新会话(默认智能体=Sisyphus)
  └─ User: /start-work
  └─ [start-work hook读取boulder.json]
  └─ "恢复'构建用户认证' - 8个任务中完成3个"
  └─ Atlas从任务3继续(无上下文丢失)

运行/start-work时自动激活Atlas。你不需要手动切换到Atlas。

boulder.json跟踪

  • active_plan: 当前计划文件路径
  • session_ids: 所有在此计划上工作的会话
  • started_at: 工作何时开始
  • plan_name: 人类可读的计划标识符

⚙️ 配置与最佳实践

提供商优先级

Native (anthropic/, openai/, google/) > Kimi for Coding > GitHub Copilot > Venice > OpenCode Zen > Z.ai Coding Plan

自定义配置

oh-my-opencode.json中覆盖:

{
  "agents": {
    "sisyphus": {
      "model": "claude-opus-4.6",
      "provider": "anthropic",
      "temperature": 0.1,
      "fallback_chain": [
        {"model": "kimi-k2-5", "provider": "kimi-for-coding"},
        {"model": "glm-5", "provider": "zai-coding-plan"}
      ]
    }
  },
  "categories": {
    "visual-engineering": {
      "model": "gemini-3-pro",
      "provider": "google"
    },
    "ultrabrain": {
      "model": "gpt-5.3-codex",
      "provider": "openai"
    }
  }
}

选择优先级

Claude优化智能体选择模型时

Claude (Opus/Sonnet) > GPT (如果智能体有双重提示) > Claude类 (Kimi K2.5, GLM 5)

GPT原生智能体选择模型时

GPT (5.3-codex, 5.2) > Claude Opus (不错回退) > Gemini (可接受)

最佳实践总结

  1. 简单任务:直接提示,不使用智能体
  2. 复杂但懒ulw让Sisyphus自主处理
  3. 复杂且精确@plan → Prometheus规划 → /start-work → Atlas执行
  4. 深度架构:切换到Hephaestus
  5. 前端/视觉:使用visual-engineering类别自动路由到Gemini
  6. 快速搜索:Explore和Librarian自动使用快速模型

故障排除

"我切换到Prometheus但什么都没发生"

Prometheus默认进入面试模式。它会问你关于需求的问题。回答它们,准备好时说"make it a plan"。

"/start-work说'找不到活动计划'"

要么:

  • .sisyphus/plans/中不存在计划 → 先用Prometheus创建一个
  • 计划存在但boulder.json指向别处 → 删除.sisyphus/boulder.json并重试

"我在Atlas但想切换回正常模式"

输入exit或开始新会话。Atlas主要通过/start-work进入 - 你通常不手动"切换到Atlas"。

"@plan和直接切换到Prometheus有什么区别?"

功能上没有区别。 都调用Prometheus。@plan是便利命令,切换智能体是显式控制。用哪个感觉自然就用哪个。

"应该用Hephaestus还是输入ulw?"

大多数任务:在Sisyphus中输入ulw

用Hephaestus当:你特别需要GPT-5.3 Codex推理风格进行深度架构工作或复杂调试。


💡 核心要点

image.png

[!success] 记住这些

  1. 智能体专业化 - 不同智能体做不同的事,协作而非单打独斗
  2. 类别优先于模型名 - 描述意图,让系统路由到最佳模型
  3. 规划与执行分离 - Prometheus规划,Atlas执行,工作者写代码
  4. 智慧积累 - 学习传递,错误不重复
  5. 会话连续 - boulder.json跟踪进度,随时恢复
  6. 多模型协作 - Claude、GPT、Gemini各司其职

准备好开始了吗? 试试看看指挥一个强大的AI Agent团队可以为你做什么?

相关文章
|
4月前
|
机器学习/深度学习 人工智能 前端开发
终端里的 AI 编程助手:OpenCode 使用指南
OpenCode 是开源的终端 AI 编码助手,支持 Claude、GPT-4 等模型,可在命令行完成代码编写、Bug 修复、项目重构。提供原生终端界面和上下文感知能力,适合全栈开发者和终端用户使用。
38455 10
|
11天前
|
人工智能 JavaScript IDE
零基础 AI 全能编程指南:OpenClaw 阿里云部署+Claude Code/OpenCode集成保姆级教程:
AI编程工具的核心痛点从来不是“功能不够强”,而是“上手门槛高”——复杂的安装命令、混乱的模型切换、不稳定的API渠道,让很多新手望而却步。2026年,这套痛点终于有了完美解决方案:以OpenRouter为稳定API中枢,搭配Claude Code(稳定版)与OpenCode(开源备用版)双引擎,再用CC-Switch统一管理模型与技能,全程支持支付宝支付,无需国外银行卡,甚至不用手动记忆复杂命令,借助AI辅助就能实现“小学二年级也能装”的零门槛体验。
2009 3
|
7天前
|
人工智能 安全 搜索推荐
OpenClaw“小龙虾”进阶保姆级攻略!阿里云/本地部署+百炼API配置+常见Skills安装方法
本文详解OpenClaw(“小龙虾”)Skills安装与安全配置:针对新手“能用不好用”痛点,系统梳理4种安装方式(含ClawHub一键安装)、阿里云极速部署全流程、百炼API配置及8大高频实用Skills(如Tavily搜索、Office自动化等),强调安全优先原则,所有命令可直接执行,助你1-2小时打造真正能做事的AI管家。
2567 15
|
9天前
|
人工智能 弹性计算 API
阿里云杀疯了!7.9 元解锁 8 款顶尖 AI 编程模型,OpenClaw 终于实现算力自由
OpenClaw用户苦Token贵久矣!阿里云百炼上线Coding Plan订阅服务,整合Qwen3.5、GLM-5、Kimi2.5等8款顶级编程模型,按次计费大幅降本,告别天价账单,5分钟极速对接,真正实现AI编程自由。
978 11
|
1月前
|
人工智能 运维 架构师
老金开源Agent Teams编排Skill:一句话自动组队,手动挡时代结束了
加我进AI讨论学习群,公众号右下角“联系方式” 文末有老金的 **开源知识库地址·全免费** --- 术语说明:"Swarm/蜂群"是多Agent协作的通用说法(OpenAI有官方项目叫Swarm),但 Claude Code的官方概念是Agent Teams。本文使用官方术语Agent Teams,保留"蜂群"作为通俗说明。 先说老金我昨儿开源了[老金开源10万字Claude Code中文
2174 10
老金开源Agent Teams编排Skill:一句话自动组队,手动挡时代结束了
|
6天前
|
人工智能 安全 数据可视化
不到60块,我在云端养了一只AI龙虾,小白也能上手的养虾指南
OpenClaw是能真正动手干活的AI代理——说“帮我调研/整理/推送”,它就自动开浏览器、搜信息、写文档、发飞书。云端部署仅45元,分钟级上线,配Coding Plan更省;装上技能包(如浏览器、搜索、安全审查),你的“电子宠物小龙虾”立刻上岗!
1149 20

热门文章

最新文章