这几天我把 OpenClaw 的一条关键链路基本跑通了:
不是“让大模型直接乱执行”,
而是“外部大模型负责规划,OpenClaw 负责治理、审计和执行”。
现在已经验证到这一步:
外部 provider 已真实接入,不再是假模型或静默降级。
复杂任务可以先由模型拆成步骤,再进入 OpenClaw 的 gate。
在 demo_workspace 这种受控沙箱里,已经可以真实创建文件、修改文件。
像桌面写入、删除文件这类更敏感动作,仍然会被打到 REVIEW,不会裸执行。
整个过程还能保留 replay / export / recovery 这些治理能力。
我现在越来越确定一件事:
Agent 真正缺的不是再多一点“智能”,
而是一个能把执行力关进笼子里的主权骨架。
下一步不会推翻现有治理核心,
而是继续做“放权但不失控”:
把 demo_workspace 内的低风险动作进一步放开,
让它更接近原版 OpenClaw 的执行力,
但真实用户目录、删除、下单、支付这类动作,继续保留 REVIEW / 确认点。









目标不是做一个只会审计的壳,
而是做一个“能真干活,但必须先受治理”的 Familiar Edition。