光聪明还不够，Agent “真干活”还缺一套趁手的工具-阿里云开发者社区

作者：黑曜、悠逸

让 Agent 进入真实业务，需要的不只是模型能力，还包括可管理、可复用、可观测的工具体系。

为什么 Agent 需要工具体系

搭建一个能够对话的 Agent 并不复杂。进入真实业务场景后，Agent 需要处理的是实时数据查询、内部接口调用、SOP 排查、外部系统操作等任务，这些能力不能只依赖模型本身，必须通过工具体系补齐。

如果从零自建工具链，通常会遇到三类问题：

1. 协议不统一。 MCP、Function Call、自定义 HTTP 各有接入方式。自建 MCP 集成时，鉴权、重试、超时、沙箱隔离都需要自行处理，任一环节缺失都可能影响生产稳定性。

2. 集成成本持续累积。 单独接入一个 fetch 工具并不困难，但当工具数量增长到十个、二十个时，注册、鉴权、错误处理、调用追踪都会变成重复建设。

3. 调试链路不透明。 模型是否触发工具、参数是否正确、工具返回了什么，自建链路往往需要额外埋点和日志拼接。排查一次问题，可能要在模型日志、工具日志和业务日志之间反复定位。

AgentRun 把这些工作收敛到平台内。开发者在工具市场中选择、安装并绑定工具后，Agent 即可在对话中触发调用；调用链路则通过调试面板和链路追踪呈现。开发者关注的是“给 Agent 配置哪些能力”，平台负责承接工具运行、适配和可观测性。

Skill 与 MCP 的平台化管理

先区分两个核心概念：

Skill 规定 Agent 的执行方式。它是一份任务说明书，用于描述步骤、边界和输出格式，例如 RAM 权限诊断、发布前检查、代码评审规范。
MCP 提供 Agent 可调用的外部动作。它是一组标准化工具能力，包含输入 schema 和返回结果，例如网页抓取、GitHub 操作、浏览器自动化、数据库查询。

实际项目中，Skill 和 MCP 经常配合使用：Skill 约束流程，MCP 提供动作。它们在 AgentRun 中的核心价值，是被平台统一管理为可复用资产。

打开控制台左侧「工具与 Skills」，已安装的工具都在同一个入口中管理：

平台资产化主要体现在四个方面：

1. 版本升级和兼容性由平台负责。 工具市场中的工具已经完成平台适配，安装后即可绑定使用；后续工具升级也不要求业务侧重复改造集成代码。

2. 安全审计在平台侧完成。 工具来源、运行环境和调用边界都在平台能力范围内管理，降低直接引入第三方脚本的风险。

3. 配置可以跨 Agent 复用。 工具资产不绑定某个模型、某段提示词或某个运行时。更换 Agent、模型或创建方式时，工具配置仍可以延续。

4. 入口和协议统一。 MCP、Function Call、Skill 三类能力在同一个入口管理，调用方式对模型透明，协议适配由平台处理。

Skill 与 MCP 的选择建议

目标	推荐能力	典型场景
约束做事方式：步骤、边界、输出格式	Skill	权限诊断、代码评审、发布检查
增加外部动作：抓数据、调接口、跑命令	MCP	网页抓取、GitHub 操作、数据库查询
交付完整业务能力：先按流程判断，再调用外部系统	Skill + MCP	按 SOP 诊断问题并自动调用修复接口

生产场景通常不是二选一。更常见的模式是：Skill 负责“怎么做”，MCP 负责“能调用什么”。

在工具市场发现和安装工具

切到「工具市场」Tab，可以搜索或浏览平台提供的工具。

工具市场中的工具已经完成平台适配，安装后即可进入「我的工具」列表。以下几类工具适合作为入门验证：

mcp-server-fetch：从 URL 抓取网页内容，让 Agent 在回答前读取最新资料。
mcp-playwright：提供浏览器自动化能力，适用于需要页面渲染后才能获取内容的场景。
mcp-server-github：调用 GitHub API，适合代码协作和仓库分析类 Agent。
skill-alibabacloud-ram-permission-diagnose：沉淀阿里云 RAM 权限诊断流程，把排查 SOP 交给 Agent 执行。

点击工具卡片可以查看详细说明：

安装完成后，回到「我的工具」即可看到新增资产。

多合一沙箱与 AI 生成 Skill

除工具安装外，工具市场背后还有两类能力值得重点关注：

1. 多合一沙箱。 浏览器、代码执行、文件操作等能力可以被打包进同一个执行环境。开发者不需要分别接入多个工具再自行拼接，Agent 可以在统一环境中完成网页访问、代码运行和文件读写。

2. AI 辅助生成和优化 Skill。 当没有现成 Skill 覆盖团队 SOP 时，可以通过自然语言描述业务流程，由 AI 生成 SKILL.md 草稿。团队完成关键步骤、风险边界和输出格式的校准后，即可沉淀为可复用资产。

将工具绑定到 Agent 配置

安装工具只是完成资产准备。要让工具在对话中生效，还需要把它绑定到具体的 Agent 上。

打开目标 Agent 的「配置与调试」页，在「工具与上下文」区域点击「+ 工具」：

操作流程如下：

选择工具类型：Skill 或 MCP。2. 搜索并添加目标工具。3. 保存 Agent 配置。4. 新建会话，验证工具是否出现在新会话的可调用能力中。

需要注意的是，已有会话中的工具列表不会自动刷新。AgentRun 会保持会话生命周期稳定，避免配置变更影响正在进行的对话；因此建议在保存配置后通过新会话验证工具效果。

验证工具调用链路

工具安装和绑定只是控制面状态。要确认工具是否被模型正确触发，需要结合调试面板观察调用链路。下面用两个场景说明：一个验证 MCP 调用，一个演示 AI 辅助生成 Skill。

5.1 mcp-server-fetch：获取实时网页内容

挂载 mcp-server-fetch 后，在调试面板里发送示例请求：

请用工具读取 https://help.aliyun.com/zh/functioncompute/fc/what-is-agentrun 的内容，
告诉我 AgentRun 是什么。

模型识别到需要外部数据后，会触发 fetch 子工具抓取页面内容，再基于返回结果生成回答。

调试面板会展示这次调用的关键链路：

模型选择了哪个工具；
工具入参是什么，例如 URL、max_length；
工具返回了哪些内容；
调用耗时和执行状态；
最终回复是否基于工具返回结果生成。

用调试面板定位回答偏差

假设线上用户反馈 Agent 回答的产品信息不准确。通过调试面板可以直接确认本轮对话是否触发了 fetch 工具。如果发现模型没有调用工具，而是基于旧知识直接回答，问题就可以定位到提示词或工具触发策略。

修正方式也更明确：在系统提示词中要求“涉及产品文档时必须先读取最新页面”，然后重新验证工具调用。相比自建链路中分散查日志，调试面板把模型选择、入参、返回和最终回答放在同一条链路中，排障路径更短。

5.2 AI 生成 Skill：沉淀业务 SOP

RAM 权限诊断这类通用 Skill 可以直接从工具市场安装。但团队内部的 SOP 往往更具体，例如发布前检查、订单接口超时排查、内部系统故障处理等，这类流程通常没有现成 Skill 可用。

这类场景适合使用「AI 辅助生成」：

在「工具与 Skills」里点击「创建 Skill」，选择「AI 辅助生成」。
描述业务目标和执行边界，例如：“排查订单接口超时，先看网关 RT，再看下游依赖，最后给出最小范围的处理建议。”
检查 AI 生成的 SKILL.md 草稿，补充团队规范、风险边界和输出格式。
保存 Skill，并绑定到对应 Agent。
在新会话中提交同类问题，确认 Agent 是否按 Skill 定义的步骤执行。

完成后，团队经验不再局限于某段提示词或个人操作习惯，而是沉淀为可复用、可迭代的平台资产。后续其他 Agent 需要相同能力时，可以直接复用这个 Skill，并在业务流程变化时持续更新。

AgentRun 承担的工具工程能力

工具能够快速安装和绑定，并不代表平台只是做了一层请求转发。要让工具在生产环境中稳定可用，背后至少包含以下工程能力：

1. 协议统一。 MCP Server、Function Call、Skill 三种类型在同一个入口管理，调用方式对模型透明，业务侧不需要重复处理协议适配。

2. 沙箱隔离。 工具执行运行在独立沙箱中，单个工具异常不会影响 Agent 主进程，也不会影响其他工具。

3. 调用可观测。 每次工具调用都会记录到链路追踪中，耗时、入参、出参和异常状态均可查询。调试面板是这套能力面向使用者的可视化入口。

4. 版本维护。 工具市场中的工具版本由平台维护，升级不会直接破坏已绑定 Agent 的配置。

5. 能力组合。 多合一沙箱把浏览器、代码执行、文件操作打包到统一环境；AI 辅助生成和优化 Skill 则把业务 SOP 转化为可维护资产。

这些能力组合起来，带来的直接收益是：

工具不再散落在各个 Agent 的临时代码中；
团队 SOP 可以通过 Skill 统一沉淀和复用；
工具调用过程可观测，线上问题更容易定位；
Agent、模型和运行时发生变化时，工具资产仍能延续。

让工具体系成为 Agent 的基础设施

AgentRun 在工具体系上的价值，可以概括为四点：

1. 资产化管理。 工具安装、升级、兼容性和安全审计由平台统一处理，业务侧不再维护分散脚本。

2. 统一入口。 Skill、MCP、Function Call 在同一入口管理，覆盖“怎么做”和“能做什么”两类能力。

3. 低成本扩展。 多合一沙箱提供常用执行环境，AI 辅助生成 Skill 帮助团队把业务 SOP 快速资产化。

4. 全链路可观测。 调试面板和链路追踪让工具触发、参数、结果和异常都有据可查。

工具只是 Agent 能力体系的一部分。完成工具绑定后，还可以继续叠加知识库、记忆、沙箱、IM 集成、版本灰度等能力。它们可以在同一个 Agent 详情页中组合配置，逐步把 Agent 从对话入口扩展为业务执行入口。

建议从一个 MCP 工具和一个业务 Skill 开始验证：前者用于连接外部动作，后者用于沉淀团队流程。两者配合起来，才能让 Agent 从“能回答问题”进一步走向“能按业务流程完成任务”。

相关链接：

[1] AgentRun 控制台

https://functionai.console.aliyun.com/

[2] AgentRun 产品文档

https://help.aliyun.com/zh/functioncompute/fc/what-is-agentrun

[3] 工具与 Skills 介绍

https://help.aliyun.com/zh/functioncompute/fc/tools-and-skill...

[4] 使用工具市场安装和管理 AgentRun 工具

https://help.aliyun.com/zh/functioncompute/fc/tool-market

[5] AgentRun Python SDK

https://github.com/Serverless-Devs/agentrun-sdk-python

[6] AgentRun CLI

https://github.com/Serverless-Devs/agentrun-cli

[7] AgentRun 客户钉钉群群号：134570017218，如有技术问题或合作意向，欢迎联系我们。

光聪明还不够，Agent “真干活”还缺一套趁手的工具