作者:黑曜、悠逸
让 Agent 进入真实业务,需要的不只是模型能力,还包括可管理、可复用、可观测的工具体系。
为什么 Agent 需要工具体系
搭建一个能够对话的 Agent 并不复杂。进入真实业务场景后,Agent 需要处理的是实时数据查询、内部接口调用、SOP 排查、外部系统操作等任务,这些能力不能只依赖模型本身,必须通过工具体系补齐。
如果从零自建工具链,通常会遇到三类问题:
1. 协议不统一。 MCP、Function Call、自定义 HTTP 各有接入方式。自建 MCP 集成时,鉴权、重试、超时、沙箱隔离都需要自行处理,任一环节缺失都可能影响生产稳定性。
2. 集成成本持续累积。 单独接入一个 fetch 工具并不困难,但当工具数量增长到十个、二十个时,注册、鉴权、错误处理、调用追踪都会变成重复建设。
3. 调试链路不透明。 模型是否触发工具、参数是否正确、工具返回了什么,自建链路往往需要额外埋点和日志拼接。排查一次问题,可能要在模型日志、工具日志和业务日志之间反复定位。
AgentRun 把这些工作收敛到平台内。开发者在工具市场中选择、安装并绑定工具后,Agent 即可在对话中触发调用;调用链路则通过调试面板和链路追踪呈现。开发者关注的是“给 Agent 配置哪些能力”,平台负责承接工具运行、适配和可观测性。
Skill 与 MCP 的平台化管理
先区分两个核心概念:
- Skill 规定 Agent 的执行方式。它是一份任务说明书,用于描述步骤、边界和输出格式,例如 RAM 权限诊断、发布前检查、代码评审规范。
- MCP 提供 Agent 可调用的外部动作。它是一组标准化工具能力,包含输入 schema 和返回结果,例如网页抓取、GitHub 操作、浏览器自动化、数据库查询。
实际项目中,Skill 和 MCP 经常配合使用:Skill 约束流程,MCP 提供动作。它们在 AgentRun 中的核心价值,是被平台统一管理为可复用资产。
打开控制台左侧「工具与 Skills」,已安装的工具都在同一个入口中管理:
平台资产化主要体现在四个方面:
1. 版本升级和兼容性由平台负责。 工具市场中的工具已经完成平台适配,安装后即可绑定使用;后续工具升级也不要求业务侧重复改造集成代码。
2. 安全审计在平台侧完成。 工具来源、运行环境和调用边界都在平台能力范围内管理,降低直接引入第三方脚本的风险。
3. 配置可以跨 Agent 复用。 工具资产不绑定某个模型、某段提示词或某个运行时。更换 Agent、模型或创建方式时,工具配置仍可以延续。
4. 入口和协议统一。 MCP、Function Call、Skill 三类能力在同一个入口管理,调用方式对模型透明,协议适配由平台处理。
Skill 与 MCP 的选择建议
| 目标 | 推荐能力 | 典型场景 |
| 约束做事方式:步骤、边界、输出格式 | Skill | 权限诊断、代码评审、发布检查 |
| 增加外部动作:抓数据、调接口、跑命令 | MCP | 网页抓取、GitHub 操作、数据库查询 |
| 交付完整业务能力:先按流程判断,再调用外部系统 | Skill + MCP | 按 SOP 诊断问题并自动调用修复接口 |
生产场景通常不是二选一。更常见的模式是:Skill 负责“怎么做”,MCP 负责“能调用什么”。
在工具市场发现和安装工具
切到「工具市场」Tab,可以搜索或浏览平台提供的工具。
工具市场中的工具已经完成平台适配,安装后即可进入「我的工具」列表。以下几类工具适合作为入门验证:
mcp-server-fetch:从 URL 抓取网页内容,让 Agent 在回答前读取最新资料。mcp-playwright:提供浏览器自动化能力,适用于需要页面渲染后才能获取内容的场景。mcp-server-github:调用 GitHub API,适合代码协作和仓库分析类 Agent。skill-alibabacloud-ram-permission-diagnose:沉淀阿里云 RAM 权限诊断流程,把排查 SOP 交给 Agent 执行。
点击工具卡片可以查看详细说明:
安装完成后,回到「我的工具」即可看到新增资产。
多合一沙箱与 AI 生成 Skill
除工具安装外,工具市场背后还有两类能力值得重点关注:
1. 多合一沙箱。 浏览器、代码执行、文件操作等能力可以被打包进同一个执行环境。开发者不需要分别接入多个工具再自行拼接,Agent 可以在统一环境中完成网页访问、代码运行和文件读写。
2. AI 辅助生成和优化 Skill。 当没有现成 Skill 覆盖团队 SOP 时,可以通过自然语言描述业务流程,由 AI 生成 SKILL.md 草稿。团队完成关键步骤、风险边界和输出格式的校准后,即可沉淀为可复用资产。
将工具绑定到 Agent 配置
安装工具只是完成资产准备。要让工具在对话中生效,还需要把它绑定到具体的 Agent 上。
打开目标 Agent 的「配置与调试」页,在「工具与上下文」区域点击「+ 工具」:
操作流程如下:
- 选择工具类型:Skill 或 MCP。2. 搜索并添加目标工具。3. 保存 Agent 配置。4. 新建会话,验证工具是否出现在新会话的可调用能力中。
需要注意的是,已有会话中的工具列表不会自动刷新。AgentRun 会保持会话生命周期稳定,避免配置变更影响正在进行的对话;因此建议在保存配置后通过新会话验证工具效果。
验证工具调用链路
工具安装和绑定只是控制面状态。要确认工具是否被模型正确触发,需要结合调试面板观察调用链路。下面用两个场景说明:一个验证 MCP 调用,一个演示 AI 辅助生成 Skill。
5.1 mcp-server-fetch:获取实时网页内容
挂载 mcp-server-fetch 后,在调试面板里发送示例请求:
请用工具读取 https://help.aliyun.com/zh/functioncompute/fc/what-is-agentrun 的内容, 告诉我 AgentRun 是什么。
模型识别到需要外部数据后,会触发 fetch 子工具抓取页面内容,再基于返回结果生成回答。
调试面板会展示这次调用的关键链路:
- 模型选择了哪个工具;
- 工具入参是什么,例如 URL、
max_length; - 工具返回了哪些内容;
- 调用耗时和执行状态;
- 最终回复是否基于工具返回结果生成。
用调试面板定位回答偏差
假设线上用户反馈 Agent 回答的产品信息不准确。通过调试面板可以直接确认本轮对话是否触发了 fetch 工具。如果发现模型没有调用工具,而是基于旧知识直接回答,问题就可以定位到提示词或工具触发策略。
修正方式也更明确:在系统提示词中要求“涉及产品文档时必须先读取最新页面”,然后重新验证工具调用。相比自建链路中分散查日志,调试面板把模型选择、入参、返回和最终回答放在同一条链路中,排障路径更短。
5.2 AI 生成 Skill:沉淀业务 SOP
RAM 权限诊断这类通用 Skill 可以直接从工具市场安装。但团队内部的 SOP 往往更具体,例如发布前检查、订单接口超时排查、内部系统故障处理等,这类流程通常没有现成 Skill 可用。
这类场景适合使用「AI 辅助生成」:
- 在「工具与 Skills」里点击「创建 Skill」,选择「AI 辅助生成」。
- 描述业务目标和执行边界,例如:“排查订单接口超时,先看网关 RT,再看下游依赖,最后给出最小范围的处理建议。”
- 检查 AI 生成的 SKILL.md 草稿,补充团队规范、风险边界和输出格式。
- 保存 Skill,并绑定到对应 Agent。
- 在新会话中提交同类问题,确认 Agent 是否按 Skill 定义的步骤执行。
完成后,团队经验不再局限于某段提示词或个人操作习惯,而是沉淀为可复用、可迭代的平台资产。后续其他 Agent 需要相同能力时,可以直接复用这个 Skill,并在业务流程变化时持续更新。
AgentRun 承担的工具工程能力
工具能够快速安装和绑定,并不代表平台只是做了一层请求转发。要让工具在生产环境中稳定可用,背后至少包含以下工程能力:
1. 协议统一。 MCP Server、Function Call、Skill 三种类型在同一个入口管理,调用方式对模型透明,业务侧不需要重复处理协议适配。
2. 沙箱隔离。 工具执行运行在独立沙箱中,单个工具异常不会影响 Agent 主进程,也不会影响其他工具。
3. 调用可观测。 每次工具调用都会记录到链路追踪中,耗时、入参、出参和异常状态均可查询。调试面板是这套能力面向使用者的可视化入口。
4. 版本维护。 工具市场中的工具版本由平台维护,升级不会直接破坏已绑定 Agent 的配置。
5. 能力组合。 多合一沙箱把浏览器、代码执行、文件操作打包到统一环境;AI 辅助生成和优化 Skill 则把业务 SOP 转化为可维护资产。
这些能力组合起来,带来的直接收益是:
- 工具不再散落在各个 Agent 的临时代码中;
- 团队 SOP 可以通过 Skill 统一沉淀和复用;
- 工具调用过程可观测,线上问题更容易定位;
- Agent、模型和运行时发生变化时,工具资产仍能延续。
让工具体系成为 Agent 的基础设施
AgentRun 在工具体系上的价值,可以概括为四点:
1. 资产化管理。 工具安装、升级、兼容性和安全审计由平台统一处理,业务侧不再维护分散脚本。
2. 统一入口。 Skill、MCP、Function Call 在同一入口管理,覆盖“怎么做”和“能做什么”两类能力。
3. 低成本扩展。 多合一沙箱提供常用执行环境,AI 辅助生成 Skill 帮助团队把业务 SOP 快速资产化。
4. 全链路可观测。 调试面板和链路追踪让工具触发、参数、结果和异常都有据可查。
工具只是 Agent 能力体系的一部分。完成工具绑定后,还可以继续叠加知识库、记忆、沙箱、IM 集成、版本灰度等能力。它们可以在同一个 Agent 详情页中组合配置,逐步把 Agent 从对话入口扩展为业务执行入口。
建议从一个 MCP 工具和一个业务 Skill 开始验证:前者用于连接外部动作,后者用于沉淀团队流程。两者配合起来,才能让 Agent 从“能回答问题”进一步走向“能按业务流程完成任务”。
相关链接:
[1] AgentRun 控制台
https://functionai.console.aliyun.com/
[2] AgentRun 产品文档
https://help.aliyun.com/zh/functioncompute/fc/what-is-agentrun
[3] 工具与 Skills 介绍
https://help.aliyun.com/zh/functioncompute/fc/tools-and-skill...
[4] 使用工具市场安装和管理 AgentRun 工具
https://help.aliyun.com/zh/functioncompute/fc/tool-market
[5] AgentRun Python SDK
https://github.com/Serverless-Devs/agentrun-sdk-python
[6] AgentRun CLI
https://github.com/Serverless-Devs/agentrun-cli
[7] AgentRun 客户钉钉群群号:134570017218,如有技术问题或合作意向,欢迎联系我们。