06|Skills、Commands、Rules、Hooks 到底各管什么

简介: 本文厘清Agent Harness中Skills、Commands、Rules、Hooks四大核心概念的边界与协作:Rules规范长期习惯,Skills封装多步流程,Commands提供快捷入口,Hooks实现强制自动化。四者分层协同,助团队将经验沉淀为稳定、可演进的智能工作流。(239字)

屏幕截图 2026-05-29 172331.png

用 Agent Harness 久了,会遇到一组容易混淆的概念:Skills、Commands、Rules、Hooks。

它们都能“影响 Agent 行为”,但作用层级不一样。如果混着用,项目配置会很快变乱;如果分清边界,它们能把团队经验沉淀成稳定工作流。

可以先用一句话区分:

Rules 规定长期习惯
Skills 封装复杂流程
Commands 提供快捷入口
Hooks 在固定时机自动执行

Rules:长期规则

Rules 是给模型看的长期约定。

比如:

本项目使用 pnpm,不要使用 npm。
后端接口必须返回统一错误结构。
修改权限逻辑必须补充集成测试。
不要直接修改 generated 目录。

Rules 的特点是持续生效。它们适合表达团队规范、项目约定、架构边界和代码风格。

但 Rules 不是强制执行层。模型会尽量遵守,但如果规则含糊、冲突或太长,它仍然可能漏掉。因此,Rules 适合“指导”,不适合“硬拦截”。

Skills:可复用工作流

Skills 更像一套可复用操作手册。

比如“做一次 PR Review”可能包括:

  1. 读取 diff;
  2. 识别风险文件;
  3. 检查测试覆盖;
  4. 查找安全问题;
  5. 输出 Review 结论。

这就适合做成 Skill。

再比如:

写单元测试
排查 CI 失败
分析接口兼容性
生成发布说明
执行前端视觉检查

这些都有明确流程,不适合写成一句 Rule。写成 Skill 更清楚,也能按需加载,减少上下文噪声。

Commands:入口和快捷方式

Commands 是给用户用的入口。

比如:

/review-pr
/fix-ci
/write-tests
/deploy-staging

它们的价值是降低使用门槛。团队成员不用记一大段提示词,只要调用命令即可。

Commands 可以很薄,只是触发某个 Skill;也可以自己包含一段固定提示。但长期看,复杂逻辑最好沉淀到 Skills,Commands 保持轻量。

Hooks:强制执行和自动化

Hooks 和前面三者不同。Rules、Skills、Commands 主要影响模型思考;Hooks 是在工具调用前后、文件编辑后、会话开始时等固定生命周期执行真实命令。

比如:

文件编辑后自动格式化
提交前自动运行 lint
运行 shell 前检查危险命令
禁止修改 protected 文件
会话开始时加载项目状态

Hooks 适合做强约束,因为它们不依赖模型“记不记得”。如果安全策略必须执行,就不要只写在 Rule 里,应该用 Hook 或权限规则实现。

四者如何配合

image.png

一个真实例子:

团队希望 Agent 修改支付代码时必须先写测试。

可以这样设计:

  • Rule:支付模块变更必须测试先行;
  • Skill:payment-tdd 定义具体流程;
  • Command:/payment-fix 作为入口;
  • Hook:提交前强制运行支付测试。

这样既有指导,也有流程,还有硬验证。

常见误用

第一,把所有东西都写进 Rules。

结果是规则文件越来越长,模型读了也抓不住重点。多步骤流程应该放 Skills,不是 Rules。

第二,用 Rules 做强制安全。

比如“不要运行删除命令”只写在规则里是不够的。应该用权限 deny 或 PreToolUse Hook 拦截。

第三,Commands 过度复杂。

一个命令里塞几百行说明,后期很难维护。命令应该像按钮,复杂逻辑放到 Skill。

第四,Hooks 太重。

每次编辑都跑全量测试,会让 Agent 变慢。Hooks 要分级:轻量检查放高频,重检查放提交前或用户确认后。

设计建议

Rules 要短。只保留每次任务都应该知道的约定。

Skills 要专。一个 Skill 解决一类任务,不要做成万能流程。

Commands 要少。高频任务做命令,低频任务用自然语言即可。

Hooks 要稳。只把真正需要自动化或强约束的事放进去。

可以用下面这张表判断放哪里:

内容 放哪里
项目长期规范 Rules
多步骤工作流 Skills
高频快捷入口 Commands
必须执行的检查 Hooks
高风险操作拦截 Permissions + Hooks

总结

Skills、Commands、Rules、Hooks 都是 Harness 的扩展方式,但边界不同。

真正成熟的团队,不会只靠提示词驱动 Agent,而会把经验分层沉淀:

Rules 管习惯
Skills 管流程
Commands 管入口
Hooks 管强制动作
Permissions 管边界

这样 Agent 才会越来越像团队成员,而不是每次都从零开始学习规矩。

目录
相关文章
|
6小时前
|
人工智能 IDE 定位技术
Understand-Anything:不用硬啃源码,把项目变成一张能追问的知识图谱
Understand-Anything 是一款开源AI工具,通过静态分析+多智能体理解,自动构建代码库知识图谱,帮开发者快速掌握系统架构、业务流程与模块依赖。支持中文、影响分析、新人引导等,让读代码前先有“地图”。(238字)
79 3
Understand-Anything:不用硬啃源码,把项目变成一张能追问的知识图谱
|
6小时前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
288 1
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
3月前
|
人工智能 Linux API
【最全】OpenClaw 阿里云/MacOS/Linux/Windows11本地部署流程+百炼API / SKill 接入及常见问题解答
OpenClaw(Clawdbot)作为开源的AI代理框架,凭借本地部署的隐私性、多端交互的灵活性以及可扩展的技能包体系,成为2026年AI工具生态中极具实用性的本地智能助手。与传统对话式AI不同,OpenClaw可通过技能包(Skills)实现浏览器操作、文件管理、办公自动化等实际工作流的落地,且能运行在MacOS、Linux、Windows11等主流系统,同时支持对接阿里云百炼等免费大模型资源,满足零基础用户的本地部署需求。本文将从多系统部署流程、阿里云百炼API配置、核心技能安装、常见问题解答四个维度,为新手提供完整的OpenClaw使用指南,全程无需专业代码基础,仅需跟随步骤执行命令即
842 3
|
3月前
|
人工智能 安全 网络安全
保姆级图文教程!OpenClaw(Clawdbot)阿里云/本地零基础部署:集成5700+必备 Skill,效率提升3-5倍
2026年初,OpenClaw(昵称“小龙虾”)以72小时狂揽60,000+ GitHub Stars的速度爆红,如今星标数已突破22万,不仅带动相关硬件热销,更重塑了人们对AI助手的认知。但很多用户部署后却陷入困惑:“工具看似强大,实际用起来却没发挥出预期价值”。
1081 1
|
6小时前
|
存储 人工智能 自然语言处理
拒绝“大模型幻觉”:一文彻底搞懂 RAG(检索增强生成)技术全流程
本文深入解析RAG(检索增强生成)技术,直击大模型落地私有知识场景的核心痛点——如何让LLM精准、低成本、高时效地基于企业文档作答。从文本分片、向量化索引,到召回重排、增强生成,系统拆解五大关键步骤,揭示RAG作为“AI外挂”的底层逻辑与工程实践精髓。
313 5
拒绝“大模型幻觉”:一文彻底搞懂 RAG(检索增强生成)技术全流程
|
6小时前
|
人工智能 安全
还在用 Codex 开xhigh 拉满跑?夯错了小老弟
Codex 的 `xhigh` 并非万能钥匙:它专为深度研究、安全审计等极难任务设计,耗时耗资高。日常开发用 `medium` 更稳,轻任务选 `low`,复杂逻辑才升 `high`。真正该拉满的,是人的判断力,而非模型推理档位。(239字)
还在用 Codex 开xhigh 拉满跑?夯错了小老弟
|
6小时前
|
人工智能 安全 前端开发
面试官问:什么是 Harness 工程?AI Agent 时代,测试人必须补上的新能力
Harness工程是AI Agent时代的“工作台”,聚焦为其构建稳定、可控、可验证的工程环境。它涵盖上下文管理、工具调用、沙箱权限、测试验证、日志观测与反馈回路,解决Agent在真实项目中因缺上下文、缺工具、缺反馈、缺边界导致的失控问题。本质是让Agent“能做事、做得对、出错可修复”。
|
6小时前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
326 4
|
6小时前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
258 2
|
6小时前
|
机器学习/深度学习 人工智能 算法
🔥【零基础逆袭】我用Python写了个量化策略,3天赚了别人3年的钱!(附完整代码+教程)
这是一份零基础量化交易入门指南,用4章带你从炒股小白进阶为量化新手:第一章破除认知误区,第二章下载真实股票数据,第三章编写移动平均线策略,第四章回测验证盈利性。全程仅需100行Python代码,无需金融或编程背景,边学边练,真实可运行!