阿里云新发的AgentRun 有哪些“大招”,一文详解来了

简介: 函数计算 AgentRun 是一站式 Agentic AI 基础设施平台,基于 Serverless 架构,提供毫秒弹性、安全沙箱、模型工具治理、全链路可观测等能力,助力企业实现从原型到生产的平滑演进,让 AI Agent 真正落地生产。

AI Agent 正从技术概念快步走向生产应用。然而,当开发者试图将原型推向生产环境时,一道巨大的“生产化鸿沟”随之显现:众多开源框架虽提供了强大的“大脑”,却缺失了企业级应用赖以为生的“基础设施”。

开发者实现从“原型”到“产品”的每一步,都充满了基础设施的挑战。要跨越这道鸿沟,需要的不仅仅是更聪明的模型,而是能全面解决这些问题的基础设施平台。这正是我们开发函数计算 AgentRun 的初衷。

企业级 Agent 面临的三个痛点

  1. 执行环境复杂、运维困难运行时环境与沙箱为 Agent 提供需要执行代码、操作浏览器、调用系统能力,往往会面临一系列挑战:配置多语言、管理依赖和更新安全补丁等产生高昂的维护负担;传统运行环境在大规模并发执行下的性能瓶颈;脆弱的安全隔离可能引发数据泄露等重大风险。更关键的是,日益复杂的会话状态管理也让 Agent 开发复杂度指数级增长。
  2. 外部依赖不稳定、成本高大模型调用稳定性是 Agent 应用的最大隐患。模型厂商的限流、超时、服务中断时有发生,一旦主模型出现问题,整个应用就会瘫痪。同时,Agent 需要调用大量工具和 API,每个工具的集成都要处理不同的调用方式、参数格式、鉴权逻辑,开发维护成本极高。更棘手的是,企业对接多个模型和工具,但缺乏统一的容错和治理机制,成本快速累加却难以优化。
  3. 运行过程的“黑盒”状态
    Agent 应用的调用链路复杂,从用户请求到模型推理、知识库检索、工具调用、MCP 执行,中间经过多个环节且可能反复调用。任何一个环节的性能瓶颈或错误都会影响最终效果,但传统日志和监控手段很难清晰追踪整个过程。开发者不知道哪个环节慢、哪里出错,这种黑盒状态让问题定位和成本优化都极其困难。

显然,要让 Agent 应用真正落地,开发者迫切需要一个能屏蔽底层复杂性、具备一站式治理能力的专业级基础设施平台。

函数计算 AgenRun 是什么?

一句话介绍: 函数计算 AgentRun 是一个以高代码为核心的一站式 Agentic AI 基础设施平台。秉持生态开放和灵活组装的理念,为企业级 Agent 应用提供从开发、部署到运维的全生命周期管理。

函数计算 AgentRun 架构图

AgentRun 运行时基于阿里云函数计算 FC 构建,继承了 Serverless 计算极致弹性、按量付费、零运维的核心优势。通过深度集成 AgentScope、Langchain、RAGFlow、Mem0 等主流开源生态。AgentRun 将 Serverless 的极致弹性、零运维和按量付费的特性与 AI 原生应用场景深度融合,助力企业实现成本与效率的极致优化,平均 TCO 降低 60%

让开发者只需专注于 Agent 的业务逻辑创新,无需关心底层基础设施,让 Agentic AI 真正进入企业生产环境。

立即体验 AgentRun(建议PC端打开):https://fcnext.console.aliyun.com/agent-run/cn-hangzhou/agent/explore

五大核心能力,解决企业级 Agent 生产场景难题

开发者开发— AgentRun—用户使用

核心功能 1:毫秒级极致弹性,真正按需付费

AgentRun 针对 Agent 特性深度优化,实现性能与成本的极致平衡。

  • 极致弹性:支持从 0 到百万级并发极致弹性,配合忙闲时精细化计费,大幅降低成本。
  • 浅休眠与深休眠:通过请求感知调度、实例冻结以及内存快照技术,实现 Agent 运行时与沙箱在无请求时自动休眠。浅休眠1毫秒极速唤醒实现百倍性能加速,性能超越传统服务器、虚拟机和容器等。深休眠实现超长时间会话状态持久化以及秒级唤醒。
  • 会话亲和:借助会话亲和机制将同一会话精准路由至同一实例,突破 Serverless 无状态限制,为 Agent 提供持久的有状态上下文环境,确保复杂多轮对话的流畅性。

核心功能 2:企业级安全沙箱 Sandbox

AgentRun 提供 Code Interpreter、Browser Tool、All In One 等安全沙箱。

  • 高性能执行环境:内置开箱即用的多语言执行引擎与浏览器自动化引擎,可执行数据分析、网页抓取、表单填写等复杂任务。
  • 企业级安全保障:通过请求、实例、会话多维度算力隔离与动态挂载技术,确保数据、资源强隔离;支持细粒度权限控制与完整的日志审计功能。

核心功能 3:模型与工具的统一治理

  • 模型治理: 通过统一模型代理屏蔽 API 差异,提供模型熔断、多模型 Fallback 和负载均衡等高可用保障,以及内容审核、敏感信息过滤等安全合规能力。
  • 工具治理: 采用 MCP 标准化封装,支持 MCP 和 Function Call 双协议,通过插件机制提供自定义 Hook、智能路由、语义分析等扩展功能。

核心功能 4:全链路可观测

基于全链路追踪技术,AgentRun 实现了从请求到响应的完整可视化。精准还原 Agent 的决策路径,包括意图理解、模型推理、工具调用及知识检索等核心环节,并直观展示每一步的状态与耗时。这使得开发者能够快速定位性能瓶颈,告别盲目调试,从而大幅降低优化成本。

核心功能 5:生态开放与工程化演进

拥抱生态、开放不锁定是 AgentRun 的设计哲学

  • 无缝集成业界主流高代码框架:只需几行代码,即可将 AgentRun 的基础设施集成到业界主流高代码框架,如 AgentScope、Langchain、LlamaIndex、CrewAI、Google ADK 等。
  • 无代码到高代码一键转换:支持无代码快速搭建 Agent 实现业务敏捷落地。随着业务复杂度提升,平台支持将可视化配置转化为工程化代码,结构清晰、易于维护,轻松实现从无代码到高代码的一键转换能力,从根源上规避了重构带来的技术债务。
  • 技术自主与数据安全:深度集成 LiteLLM、Mem0、RagFlow 等开源生态组件,提供云端托管或私有化部署,确保技术自主与数据安全。

三个实测场景:AgentRun 能解决什么具体问题?

场景1:不懂代码,但希望创建生产级 Agent

“我懂业务,但不懂代码,就应该被挡在 AI 应用开发的大门之外吗?”

AgentRun 通过无代码/低代码生成 Agent 的方式打破技术壁垒。让业务人员无需编写任何代码,通过可视化界面或“一句话描述”,就能即时创建出功能强大的 Agent。更重要的是,每一个 Agent、Sandbox 都能以 MCP 形式提供,让 Agent 不仅可以调用外部工具,也能调用其他 Agent,实现像“乐高”一样相互调用的能力,组合出更复杂的应用。

不仅如此,随着业务复杂度的升级,只需一键即可将无代码 Agent 转换为高代码 Agent。技术团队可以无缝接手进行深度开发,彻底解决了低代码平台常见的“天花板”问题,实现了从快速验证到专业开发的平滑演进。

场景2:流量突增,Agent 模型服务不稳定

“我之前做过很多 AI 应用,流量少的时候还好,流量一多就头疼,限流、欠费、被封,随时会瘫痪。”

AgentRun 通过模型治理为 Agent 应用提供了一个“智能保险系统”。当主模型出现问题时,平台会自动熔断并秒级切换到备用模型,多级 Fallback 机制保障生产级 Agent 高可用。自动监控每个模型的可用性、响应时间、成功率,智能选择最优的模型。负载均衡能力可以配置多个模型实例,将流量分发到不同的账号、不同的区域,避免单点过载。成本监控会实时追踪每个模型的调用费用,当费用接近阈值时自动预警,甚至可以自动触发限流或降级策略。安全围栏会在模型调用前后自动进行内容审核和敏感信息过滤,确保合规性。

场景3:凭证管理:零信任环境下的动态凭证注入

“如何在不泄露用户密钥(AccessKey)的前提下,让 Agent 安全地调用需要权限的工具?这是一个巨大的安全挑战。”

AgentRun 首创的凭证管理功能,通过 Hook 机制完美解决标准 MCP 协议不支持动态注入的问题,它就像一个“安全中介”,在 Agent 调用工具前(前置Hook)会拦截请求,根据用户身份从凭证库中动态注入密钥;在任务完成后(后置 Hook)立即清理所有敏感信息并记录审计日志。整个过程,大模型和外部环境完全接触不到真实密钥,无懈可击。此外,AgentRun 支持将多个 API 打包成一个 MCP 工具,通过规则路由和智能路由能力,节约成本和提升性能。

函数计算 AgentRun 的落地实践

  • 模型服务:函数计算 AgentRun与国内最大的 AI 模型社区 ModelScope 魔搭深度合作。通过 AgentRun,开发者可实现一键托管,最快 30 秒将开源模型转化为生产级可用、兼容 OpenAI 规范的 API,无需进行繁琐的环境搭建和部署,大幅加速了从模型到应用的“最后一公里”。吉利/极氪等头部厂商,也大量使用模型运行时托管文生图,文生语音等领域模型,支撑智能座舱等关键业务。
  • 智能体应用:函数计算 AgentRun 支撑多家行业头部基础模型厂商,构建面向千万用户的 C 端智能体应用如 Z.ai。通过 AgentRun 提供的虚拟机级安全隔离、大规模实时弹性以及忙闲智能计费,完美解决了稀疏调用与“爆款”流量并存的复杂场景,实现了安全、体验与成本的极致平衡。
  • AI 工具生态:函数计算 AgentRun 为阿里云百炼 MCP Server 提供 Serverless 运行时底座。AgentRun 的实例缩 0 和闲置计费等能力,让这些工具服务在没有流量时,成本降低 85%,甚至为 0。除此之外,Qwen 模型训练中的强化学习任务,通过函数计算 Sandbox 支撑脉冲式负载,峰值规模达到数十万核。

立即开始:一步从 Demo 到生产

总结&展望

AgentRun 的愿景很简单:让 AI Agent 从 Demo 到生产级部署,变得前所未有的简单。通过 Serverless 架构持续优化成本并解放运维负担,通过企业级 Runtime 提供生产级的执行环境和安全保障,通过开源生态集成避免框架锁定,通过全链路可观测让每个环节都清晰可控——这就是 AgentRun 要为企业提供的完整解决方案。

我们深知,Agent 应用的真正价值,不在于演示有多炫酷,而在于能否真正稳定、安全、高效地为企业创造价值。这正是我们打造 AgentRun 的初心,也是我们持续投入和优化的方向。无论您是想快速验证想法的创业者,还是构建企业级应用的开发团队,AgentRun 都将是您从第一行代码到百万级用户,始终值得信赖的基础设施伙伴。

一图看懂 AgentRun

相关文章
|
7天前
|
人工智能 运维 Serverless
AgentScope 拥抱函数计算 FC,为 Agent 应用提供 Serverless 运行底座
AgentScope推出Serverless运行时,直面AI Agent部署成本高、运维复杂、资源利用率低三大痛点。通过“按需启动、毫秒弹性、零运维”架构,实现低成本、高弹性、强隔离的智能体部署,助力多智能体应用从实验迈向规模化落地。
|
9天前
|
人工智能 运维 安全
SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道
SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道
116 15
|
10天前
|
数据管理 编译器 C++
为什么好多人电脑都是一样的报错。为什么好多游戏和应用安装报错都一样?
简介: 0xc000007b报错常见于游戏和软件启动失败,主要因缺失或版本不符的Visual C++ 运行库所致。多数程序依赖该运行库提供的基础功能,如数学运算、内存管理、文件读写等。若系统中缺少对应版本(如2015、2022),或32/64位不匹配,均会导致报错。解决方法包括安装完整VC运行库、修复损坏DLL文件。建议用户安装VC运行库合集,确保兼容性。
78 5
|
17天前
|
自然语言处理 JavaScript 前端开发
全面解析 i18n:从概念到实践,再到底层原理
本文系统讲解国际化(i18n)的核心概念与实现原理,涵盖多语言文本、日期、数字、复数等处理方式,结合 i18next 与 Vue I18n 实战案例,深入剖析资源分离、环境识别与动态替换三大机制,并分享插值、格式化、CI/CD 集成等最佳实践,助力构建可扩展的全球化应用。
239 14
|
存储 人工智能 监控
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
本文介绍了一种基于LLM的“自我编程”Agent系统,通过代码驱动实现复杂逻辑。该Agent以Python为执行引擎,结合Py4j实现Java与Python交互,支持多工具调用、记忆分层与上下文工程,具备感知、认知、表达、自我评估等能力模块,目标是打造可进化的“1.5线”智能助手。
1152 62
|
18天前
|
消息中间件 缓存 前端开发
WebSocket 与 MQTT 在即时通讯中的深度对比与架构选型指南
WebSocket 是双向通信通道,适合前端实时交互;MQTT 是轻量级消息协议,支持发布/订阅与可靠传输。二者互补,常结合使用:前端通过 WebSocket 接入,后端以 MQTT 实现高并发消息分发,构建可扩展的现代即时通讯系统。
277 17
|
2天前
|
弹性计算 搜索推荐 应用服务中间件
阿里云服务器优惠价格表:38元1年、99元和199元收费,一个月89元和160元配置清单
阿里云爆款服务器特惠:轻量应用服务器38元/年起,ECS云服务器2核2G仅99元/年,2核4G 199元/年;4核16G 89元/月,8核32G 160元/月。香港轻量服务器25元/月起,200M带宽不限流量。GPU服务器A10/T4/V100等型号享月度优惠。更多配置及按小时计费详情,见阿里云官方活动页。
阿里云服务器优惠价格表:38元1年、99元和199元收费,一个月89元和160元配置清单
|
2天前
|
存储 运维 安全
别再把 Collector 当黑箱:OpenTelemetry Collector 拓展与自定义处理器实战指南
别再把 Collector 当黑箱:OpenTelemetry Collector 拓展与自定义处理器实战指南
65 14
|
2天前
|
人工智能 JavaScript 机器人
Coze vs Dify vs n8n:三大AI智能体开发平台全面对比
2025年三大AI智能体平台深度对比:Coze零代码快速搭建,适合个人与轻量应用;Dify专注企业级大模型应用,平衡易用与灵活;n8n强在自动化集成,支持高度定制。根据需求选型,助力高效开发。
|
9天前
|
人工智能 Java API
【Azure AI Search】如何通过Entra ID RBAC认证连接中国区 Azure AI Search
本文介绍如何在Java SDK中配置中国区AI Search资源访问。由于默认认证地址为全球环境(https://search.azure.com),在中国区需修改为https://search.azure.cn,并通过设置SearchAudience.AZURE_CHINA解决认证失败问题,确保资源正常获取。
99 18