光聪明还不够,Agent “真干活”还缺一套趁手的工具

简介: 搭一个会聊天的 Agent 不难,难的是让它跑进真实业务。AgentRun 把 Skill 和 MCP 统一管理为可复用资产:Skill 规定“怎么做”,MCP 提供“能调用什么”。从工具安装、Agent 绑定到调试面板验证链路,一条路径打通 Agent 从对话入口到业务执行入口的落地。

作者:黑曜、悠逸


让 Agent 进入真实业务,需要的不只是模型能力,还包括可管理、可复用、可观测的工具体系。


为什么 Agent 需要工具体系

搭建一个能够对话的 Agent 并不复杂。进入真实业务场景后,Agent 需要处理的是实时数据查询、内部接口调用、SOP 排查、外部系统操作等任务,这些能力不能只依赖模型本身,必须通过工具体系补齐。


如果从零自建工具链,通常会遇到三类问题:


1. 协议不统一。 MCP、Function Call、自定义 HTTP 各有接入方式。自建 MCP 集成时,鉴权、重试、超时、沙箱隔离都需要自行处理,任一环节缺失都可能影响生产稳定性。

2. 集成成本持续累积。 单独接入一个 fetch 工具并不困难,但当工具数量增长到十个、二十个时,注册、鉴权、错误处理、调用追踪都会变成重复建设。

3. 调试链路不透明。 模型是否触发工具、参数是否正确、工具返回了什么,自建链路往往需要额外埋点和日志拼接。排查一次问题,可能要在模型日志、工具日志和业务日志之间反复定位。


AgentRun 把这些工作收敛到平台内。开发者在工具市场中选择、安装并绑定工具后,Agent 即可在对话中触发调用;调用链路则通过调试面板和链路追踪呈现。开发者关注的是“给 Agent 配置哪些能力”,平台负责承接工具运行、适配和可观测性。

Skill 与 MCP 的平台化管理

先区分两个核心概念:


  • Skill 规定 Agent 的执行方式。它是一份任务说明书,用于描述步骤、边界和输出格式,例如 RAM 权限诊断、发布前检查、代码评审规范。
  • MCP 提供 Agent 可调用的外部动作。它是一组标准化工具能力,包含输入 schema 和返回结果,例如网页抓取、GitHub 操作、浏览器自动化、数据库查询。


实际项目中,Skill 和 MCP 经常配合使用:Skill 约束流程,MCP 提供动作。它们在 AgentRun 中的核心价值,是被平台统一管理为可复用资产。


打开控制台左侧「工具与 Skills」,已安装的工具都在同一个入口中管理:

平台资产化主要体现在四个方面:


1. 版本升级和兼容性由平台负责。 工具市场中的工具已经完成平台适配,安装后即可绑定使用;后续工具升级也不要求业务侧重复改造集成代码。

2. 安全审计在平台侧完成。 工具来源、运行环境和调用边界都在平台能力范围内管理,降低直接引入第三方脚本的风险。

3. 配置可以跨 Agent 复用。 工具资产不绑定某个模型、某段提示词或某个运行时。更换 Agent、模型或创建方式时,工具配置仍可以延续。

4. 入口和协议统一。 MCP、Function Call、Skill 三类能力在同一个入口管理,调用方式对模型透明,协议适配由平台处理。

Skill 与 MCP 的选择建议

目标 推荐能力 典型场景
约束做事方式:步骤、边界、输出格式 Skill 权限诊断、代码评审、发布检查
增加外部动作:抓数据、调接口、跑命令 MCP 网页抓取、GitHub 操作、数据库查询
交付完整业务能力:先按流程判断,再调用外部系统 Skill + MCP 按 SOP 诊断问题并自动调用修复接口


生产场景通常不是二选一。更常见的模式是:Skill 负责“怎么做”,MCP 负责“能调用什么”。

在工具市场发现和安装工具

切到「工具市场」Tab,可以搜索或浏览平台提供的工具。

工具市场中的工具已经完成平台适配,安装后即可进入「我的工具」列表。以下几类工具适合作为入门验证:


  • mcp-server-fetch:从 URL 抓取网页内容,让 Agent 在回答前读取最新资料。
  • mcp-playwright:提供浏览器自动化能力,适用于需要页面渲染后才能获取内容的场景。
  • mcp-server-github:调用 GitHub API,适合代码协作和仓库分析类 Agent。
  • skill-alibabacloud-ram-permission-diagnose:沉淀阿里云 RAM 权限诊断流程,把排查 SOP 交给 Agent 执行。


点击工具卡片可以查看详细说明:

安装完成后,回到「我的工具」即可看到新增资产。

多合一沙箱与 AI 生成 Skill

除工具安装外,工具市场背后还有两类能力值得重点关注:


1. 多合一沙箱。 浏览器、代码执行、文件操作等能力可以被打包进同一个执行环境。开发者不需要分别接入多个工具再自行拼接,Agent 可以在统一环境中完成网页访问、代码运行和文件读写。

2. AI 辅助生成和优化 Skill。 当没有现成 Skill 覆盖团队 SOP 时,可以通过自然语言描述业务流程,由 AI 生成 SKILL.md 草稿。团队完成关键步骤、风险边界和输出格式的校准后,即可沉淀为可复用资产。

将工具绑定到 Agent 配置

安装工具只是完成资产准备。要让工具在对话中生效,还需要把它绑定到具体的 Agent 上。


打开目标 Agent 的「配置与调试」页,在「工具与上下文」区域点击「+ 工具」:

操作流程如下:

  1. 选择工具类型:Skill 或 MCP。2. 搜索并添加目标工具。3. 保存 Agent 配置。4. 新建会话,验证工具是否出现在新会话的可调用能力中。


需要注意的是,已有会话中的工具列表不会自动刷新。AgentRun 会保持会话生命周期稳定,避免配置变更影响正在进行的对话;因此建议在保存配置后通过新会话验证工具效果。

验证工具调用链路

工具安装和绑定只是控制面状态。要确认工具是否被模型正确触发,需要结合调试面板观察调用链路。下面用两个场景说明:一个验证 MCP 调用,一个演示 AI 辅助生成 Skill。

5.1 mcp-server-fetch:获取实时网页内容

挂载 mcp-server-fetch 后,在调试面板里发送示例请求:

请用工具读取 https://help.aliyun.com/zh/functioncompute/fc/what-is-agentrun 的内容,
告诉我 AgentRun 是什么。

模型识别到需要外部数据后,会触发 fetch 子工具抓取页面内容,再基于返回结果生成回答。

调试面板会展示这次调用的关键链路:


  1. 模型选择了哪个工具;
  2. 工具入参是什么,例如 URL、max_length
  3. 工具返回了哪些内容;
  4. 调用耗时和执行状态;
  5. 最终回复是否基于工具返回结果生成。

用调试面板定位回答偏差

假设线上用户反馈 Agent 回答的产品信息不准确。通过调试面板可以直接确认本轮对话是否触发了 fetch 工具。如果发现模型没有调用工具,而是基于旧知识直接回答,问题就可以定位到提示词或工具触发策略。


修正方式也更明确:在系统提示词中要求“涉及产品文档时必须先读取最新页面”,然后重新验证工具调用。相比自建链路中分散查日志,调试面板把模型选择、入参、返回和最终回答放在同一条链路中,排障路径更短。

5.2 AI 生成 Skill:沉淀业务 SOP

RAM 权限诊断这类通用 Skill 可以直接从工具市场安装。但团队内部的 SOP 往往更具体,例如发布前检查、订单接口超时排查、内部系统故障处理等,这类流程通常没有现成 Skill 可用。


这类场景适合使用「AI 辅助生成」:


  1. 在「工具与 Skills」里点击「创建 Skill」,选择「AI 辅助生成」。
  2. 描述业务目标和执行边界,例如:“排查订单接口超时,先看网关 RT,再看下游依赖,最后给出最小范围的处理建议。”
  3. 检查 AI 生成的 SKILL.md 草稿,补充团队规范、风险边界和输出格式。
  4. 保存 Skill,并绑定到对应 Agent。
  5. 在新会话中提交同类问题,确认 Agent 是否按 Skill 定义的步骤执行。

完成后,团队经验不再局限于某段提示词或个人操作习惯,而是沉淀为可复用、可迭代的平台资产。后续其他 Agent 需要相同能力时,可以直接复用这个 Skill,并在业务流程变化时持续更新。

AgentRun 承担的工具工程能力

工具能够快速安装和绑定,并不代表平台只是做了一层请求转发。要让工具在生产环境中稳定可用,背后至少包含以下工程能力:


1. 协议统一。 MCP Server、Function Call、Skill 三种类型在同一个入口管理,调用方式对模型透明,业务侧不需要重复处理协议适配。

2. 沙箱隔离。 工具执行运行在独立沙箱中,单个工具异常不会影响 Agent 主进程,也不会影响其他工具。

3. 调用可观测。 每次工具调用都会记录到链路追踪中,耗时、入参、出参和异常状态均可查询。调试面板是这套能力面向使用者的可视化入口。

4. 版本维护。 工具市场中的工具版本由平台维护,升级不会直接破坏已绑定 Agent 的配置。

5. 能力组合。 多合一沙箱把浏览器、代码执行、文件操作打包到统一环境;AI 辅助生成和优化 Skill 则把业务 SOP 转化为可维护资产。


这些能力组合起来,带来的直接收益是:

  • 工具不再散落在各个 Agent 的临时代码中;
  • 团队 SOP 可以通过 Skill 统一沉淀和复用;
  • 工具调用过程可观测,线上问题更容易定位;
  • Agent、模型和运行时发生变化时,工具资产仍能延续。

让工具体系成为 Agent 的基础设施

AgentRun 在工具体系上的价值,可以概括为四点:


1. 资产化管理。 工具安装、升级、兼容性和安全审计由平台统一处理,业务侧不再维护分散脚本。

2. 统一入口。 Skill、MCP、Function Call 在同一入口管理,覆盖“怎么做”和“能做什么”两类能力。

3. 低成本扩展。 多合一沙箱提供常用执行环境,AI 辅助生成 Skill 帮助团队把业务 SOP 快速资产化。

4. 全链路可观测。 调试面板和链路追踪让工具触发、参数、结果和异常都有据可查。


工具只是 Agent 能力体系的一部分。完成工具绑定后,还可以继续叠加知识库、记忆、沙箱、IM 集成、版本灰度等能力。它们可以在同一个 Agent 详情页中组合配置,逐步把 Agent 从对话入口扩展为业务执行入口。


建议从一个 MCP 工具和一个业务 Skill 开始验证:前者用于连接外部动作,后者用于沉淀团队流程。两者配合起来,才能让 Agent 从“能回答问题”进一步走向“能按业务流程完成任务”。


相关链接:

[1] AgentRun 控制台

https://functionai.console.aliyun.com/

[2] AgentRun 产品文档

https://help.aliyun.com/zh/functioncompute/fc/what-is-agentrun

[3] 工具与 Skills 介绍

https://help.aliyun.com/zh/functioncompute/fc/tools-and-skill...

[4] 使用工具市场安装和管理 AgentRun 工具

https://help.aliyun.com/zh/functioncompute/fc/tool-market

[5] AgentRun Python SDK

https://github.com/Serverless-Devs/agentrun-sdk-python

[6] AgentRun CLI

https://github.com/Serverless-Devs/agentrun-cli

[7] AgentRun 客户钉钉群群号:134570017218,如有技术问题或合作意向,欢迎联系我们。

相关文章
|
2天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1583 2
|
2天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
489 2
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
13天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
14天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
879 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
2天前
|
数据采集 人工智能 搜索推荐
企业智能体的下半场,如何让智能体越用越聪明?
AgentLoop 正在邀测期,点击申请邀测资格。
193 124
|
14天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
945 8
|
9天前
|
人工智能 自然语言处理 算法
阿里云百炼Qwen 3.7 Plus与Max实测全解:性价比与多模态能力、成本深度对比
2026年,阿里云百炼平台推出的Qwen 3.7系列成为企业与开发者落地AI应用的核心选择,其中Qwen 3.7 Max与Plus作为两大旗舰版本,定位差异显著:Max是纯文本推理旗舰,专注高强度智能体与复杂逻辑任务;Plus则是多模态全能版,在保留强大文本能力的同时,补齐图像、视频理解能力,且价格大幅降低。本文基于2026年最新实测数据,从核心参数、文本能力、多模态能力、智能体表现、性价比与场景选型六大维度,全面解析两款模型的差异,为用户提供精准选型参考。
473 0
|
14天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2573 7
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型