开发者社区> 云原生> 云原生可观测

云原生可观测

关注

云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。

0
今日
2167
内容
4
活动
294
关注
2月前
|

Operation Intelligence:可观测与智能运维(AIOps)

在云原生与 AI 原生架构加速演进的今天,系统复杂性已突破传统运维的认知边界。单纯依赖日志、指标与告警的被动观测模式难以支撑实时决策与快速响应 —— 可观测性正在进化为智能决策与系统自治的核心引擎。本论坛汇聚学术先锋、技术领袖与一线实践者,深入探讨从“被动响应”到“主动认知”、从“看得见”到“看得懂、判得准、控得住”的智能跃迁之路,真正释放 Operation Intelligence 的业务与运维价值。 讲师/嘉宾简介 释放 AI 研发效能,AI 原生驱动企业架构新范式演进——周琦,阿里云智能集团云原生应用平台负责人 《AI 原生应用架构白皮书》重磅发布——周琦,阿里云智能集团云原生应用平台负责人、穆飞,阿里云智能集团资深总监,阿里云研究院负责人、郑立,稳定性保障实验室负责人、魏峻,中国科学院软件研究所研究员,博士生导师,软件工程学科方向带头人,学术学位委员会委员、倪超,浙江大学软件学院副教授 《AI 原生应用架构白皮书》 解读:加速 AI 应用发生——李艳林,阿里云智能集团资深技术专家 云原生进化论:加速 AI 应用构建最佳范式——李国强,阿里云智能集团资深产品专家 生成式 AI 在实体店现场经营中的机会与实践——赵振宇,盒马资深技术专家 满帮 AI 基建建设现状与架构选型思考——杨兴华,满帮集团产研中心研发总经理 对话:AI 原生将如何重塑应用研发范式——杨兴华,满帮集团产研中心研发总经理、郑立,中国信通院云大所云计算部副主任、才振功,浙江大学软件学院副教授、李国强,阿里云智能集团资深产品专家

407 1
5月前
|

Spring AI Alibaba 可观测原理与实践

作为当前炙手可热的 Java AI Agent 开发框架,Spring AI Alibaba 在提示词托管、上下文工程及预置 Agent 实现等领域展现出显著优势。在 Agent 从概念验证迈向生产落地的过程中,可观测性正成为开发者所关注的焦点。本次分享将深入解析 Spring AI Alibaba 框架原生的可观测性实现机制,并演示如何通过 LoongSuite Java Agent 无缝集成,快速构建和使用覆盖 Agent 全链路的可观测性。 **讲师:**张铭辉|阿里云研发工程师

702 1

云产品可观测平台Alibaba Cloud Lens发布

随着云原生时代的到来企业基础设施规模的扩大,云上资源愈发复杂,架构更加多样,如果缺乏有效的云管理能力,将不可避免造成巨大的资源浪费和成本支出。Flexera 调研表明,79% 的企业在如何使用云产品上,普遍缺乏经验的挑战。本次发布的Alibaba Cloud Lens 作为云产品可观测平台,可以从成本、性能、安全、数据保护、稳定性、访问分析六个纬度,提供对存储类、网络类、数据库类等云产品的精细化运维管理能力。让企业在保障业务敏捷性的前提下,低门槛实现对云产品的可观测,优化用云成本。讲师/嘉宾简介孟威,阿里云智能产品专家其冀,阿里云智能产品专家七贤,阿里云智能产品专家孙玉梅,阿里云智能高级研发工程师

23353 2
29天前
|

构建运维世界模型之路:UModel 数据建模全景解读

从零构建对 UModel 的系统认知,全面解析其在数据体系中的定位、组成与关键能力。 讲师/嘉宾简介 张城(元乙)|高级技术专家

164 1

可视化能力升级!Grafana 10 能力详解

Grafana 10 新版本已正式发布,不仅仅是引入了新的功能,还带来了更好的分析洞察能力、更高的协同效率及更美观的仪表盘。那么,就由阿里云工程师带我们深度了解 Grafana 10的全新功能与升级。讲师/嘉宾简介苏墨馨|云原生可观测工程师

11428 4
29天前
|

从集成到稳定:UModel API 集成与运维自愈机制详解

深入解析 UModel 的 PaaS API 设计理念与集成实践路径;同时系统梳理高频使用问题与典型报错场景,提升用户独立运维与快速恢复能力。从“如何接”到“出了问题怎么查”,帮助开发者和运维团队构建更可靠、可持续的 UModel 应用体系。 讲师/嘉宾简介 张鑫(千乘)|技术专家

53 0
29天前
|

从定位到关联:构建 UModel 数据发现与链路分析的全链路能力

聚焦 UModel 核心查询能力,系统讲解通过元数据查询与实体检索快速定位字段来源、模型定义与业务上下文;借助图查询能力可视化展现模型间依赖关系,揭示调用链路与影响范围。两大能力层层递进,全面提升建模系统的可追溯性与治理效率。 讲师/嘉宾简介 任建(路遥)|高级工程师、隰宗正(霜键)|高级工程师

146 0
29天前
|

模型 · 实体 · 指标:UModel 多维度探索机制设计与实践

系统讲解 UModel 三大核心浏览组件的定位与实战应用:通过 UModel Explorer 实现模型结构的全局可视化,掌握整体依赖与变更脉络;借助 Entity Explorer 深入业务实体定义,理解字段语义与上下文关系;利用 MetricSet Explorer 快速定位关键业务指标,支撑高效监控与分析。三者协同,构建全链路数据认知体系。 讲师/嘉宾简介 隰宗正(霜键) |高级工程师、 王涛(灵亦)|技术专家

99 0
5月前
|

零代码改造!LoongSuite AI 采集套件观测实战

在 AI 时代,随着模型和应用侧的快速演化,对于推理过程,成本和性能显得尤为重要,而端到端的 AI 可观测是其中至关重要的一环。本文将介绍端到端 AI 可观测的基本概念与痛点,并通过阿里云可观测团队最新开源的 AI 采集套件 LoongSuite Agent 来对大模型应用进行全链路可观测以解决这些痛点。帮助客户无侵入,低成本地进行全链路的大模型可观测。 讲师:刘子明|阿里云研发工程师

349 0

2025 AI 原生编程挑战赛·赛题解析

2025 AI 原生编程挑战赛·赛题解析

495 0

Grafana服务: 9.x版本上线及新功能介绍

阿里云Grafana服务是阿里云云原生团队和Grafana Labs合作推出的云原生可观测统一解决方案。近期全新上线9.x版本,Grafana服务 9.x版本新增哪些功能特性?这些新功能特性需要如何使用呢?本期议题将为您揭晓答案。讲师/嘉宾简介姜维|阿里云技术专家

1052 0

可观测技术沙龙《基于Elasticsearch的指标可观测实践》

可观测技术沙龙(开源探索)主题:《基于Elasticsearch的指标可观测实践》演讲人:魏子珺

472 0

打造最佳生产告警体系,Grafana & ARMS告警实践

运维工程师时常遇到以下问题:(1)数据源、告警配置分散在不同系统,告警发生时没有统一告警渠道及信息,造成误导?(2)线上业务出现问题时,各种全员告警,却无人接手?基于Grafana与ARMS告警的多通知方式与算法降噪,我们更轻松的处理错报、误报等常见告警,降低项目风险。讲师/嘉宾简介姜维(阿里云技术专家)

10908 3

可观测技术沙龙《阿里云ACK容器服务生产级可观测体系建设实践》

可观测技术沙龙(行业实践)主题:《阿里云ACK容器服务生产级可观测体系建设实践》演讲人:冯诗淳(行疾) 阿里云-云原生ACK容器服务 团队

499 0
|
运维 监控 应用服务中间件
|

使用Kubernetes监控发现资源使用,流量分布不均匀的问题

为了支持日益增长的用户请求流量,大规模系统架构追求服务实例无状态可水平扩展的特性。这就要求流量均匀分配到各服务实例,容器和节点的资源使用也尽可能平均,否则热点问题将严重拖累系统性能,导致严重故障。因此,如何从流量及资源两个维度的监控数据,快速发现热点问题,提前消除隐患,成为kubernetes监控的重点。

586 0

云原生可观测技术公开课:ARMS智能告警最佳实践

年轻有为的运维工程师 小A 刚接手公司最核心业务系统的稳定性保障工作,他遇到了三大难题“不知道该关注哪些指标”、“不知道该设置什么阈值”以及“不知道怎么给起伏不定的指标配置告警规则”。本期直播我们将围绕小 A 遇到的这三个问题,跟大家介绍ARMS新上的智能告警功能,帮小A轻松运维公司核心系统。讲师/嘉宾简介陈昆仪(图杨)

872 0
|
监控 Cloud Native 架构师
|

应用实时监控服务ARMS-持续性能分析实践解析

讲师:杨龙 (阿里云程序语言与编译器部JVM工具开发专家)介绍:应用性能剖析是一种分析程序的时间和资源占用的方法。更好的应用性能,可以提供更好的用户体验,可以降低企业IT成本,可以让系统更稳定和可靠。本期内容将介绍如何利用ARMS Continuous Profiler去定位和修复应用性能问题。

38883 1

阿里云 x Elastic 联合Meetup “Elasticsearch 在可观测性软件架构服务中的应用实践”

阿里云 x Elastic 联合Meetup 北京站“Elasticsearch 在可观测性软件架构服务中的应用实践”马小鹏 阿里云高级技术专家

1243 0

弹性计算云上可观测性能力构建

云上自动化运维CloudOps系列沙龙主题:弹性计算云上可观测能力构建讲师:杨泽强 阿里云弹性计算SRE技术专家

494 1

可观测技术沙龙《Open,composable observability with Grafana and Prometheus》

可观测技术沙龙(开源探索) 主题:《Open,composable observability with Grafana and Prometheus》演讲人:Marcus OlssonGrafana Labs 布道师

751 0

微服务应用灰度发布最佳实践

灰度发布的典型场景在DevOps研发流程中集成灰度发布典型场景的落地示例讲师/嘉宾简介张裕,云效产品架构师。BizDevOps白皮书核心作者、云效研发效能三板斧核心讲师。曾任企业DevOps工具团队负责人,写得了代码、出得了方案、写得了文章,从业近二十年,对软件工程有自己深入的理解。

719 0

飞天发布时刻|ARMS,日志服务SLS产品能力升级

在数字化转型的浪潮中,云计算的深化应用不断推动着技术边界的扩展,而可观测性作为确保系统稳定运行与高效迭代的关键支撑,正逐渐成为现代云原生架构不可或缺的一部分。5月22日10:00,阿里云飞天发布时刻,阿里云应用实时监控服务 ARMS 将宣布全面升级。这次发布不仅标志着阿里云技术实力的演进,更是对企业需求深刻洞察后的创新实践。本次发布会现场,阿里云云原生应用平台资深产品专家李国强将携手阿里云应用实时监控服务 ARMS 研发负责人周洋,共同解读此次应用实时监控服务 ARMS 的全面升级与技术创新,如何满足当下企业多元化场景下的可观测需求。讲师/嘉宾简介李国强|阿里云云原生应用平台资深产品专家周洋|阿里云应用实时监控服务 ARMS 研发负责人

576 57

云效流水线 YAML 详解

为什么引入YAML流水线不只是as code — 云效YAML能力概览使用API和YAML流水线批量管理研发流程后续发展方向讲师/嘉宾简介崔力强,阿里云高级技术专家,云效流水线技术负责人,自2017年以来至今一直负责云效 CI/CD 平台的技术研发,对企业 CI/CD 有深入的见解。《微服务设计》中文版译者,有代码洁癖。

526 1

可观测技术沙龙《可观测技术发展趋势》

可观测技术沙龙(主会程)主题:《可观测技术发展趋势》演讲人:栗蔚中国信息通信技术研究院云大所副所长

53716 1

可观测技术沙龙《万节点规模云服务的SRE能力建设》

飞天club可观测技术峰会(行业实践)主题:《万节点规模云服务的SRE能力建设》演讲人:宋傲

526 48
|
存储 运维 监控
|

PyCon2021-可观测性平台下的低代码技术实践

PyCon2021-可观测性平台下的低代码技术实践

469 0
|
运维 监控 应用服务中间件
|

探索应用架构,发现预期外的网络流量

1、什么是K8s监控2、我们为何需要K8s监控?3、如何探索应用架构,发现预期外的流量

451 0
|
运维 监控 应用服务中间件
|

如何进行CDN以及下载优化分析

1、CDN对于网站体验的影响2、如何进行CDN评估与优化3、对于官网下载,我们该关注哪些要素

510 0
|
运维 监控 应用服务中间件
|

业务&用户体验可观测场景解读

本次直播将从用户体验监控的重要性出发,结合阿里巴巴和客户案例分享用户体验监控的核心场景及落地实践。

444 0

观测云实践学堂03期《温故而知新- Kubernetes可观测实践》

观测云实践学堂03期《温故而知新- Kubernetes可观测实践》

587 0

使用 Kubectl 部署 web 服务到 K8s 集群

本场景将提供一台 ECS 实例(云服务器)和 Kubernetes(简称 k8s) 集群,其中 k8s 集群由容器服务 Kubernetes 版 ACK 提供。通过本教程的操作,带您体验如何使用 k8s 的原生命令 kubectl 部署一个 web 应用(魔方应用)的镜像到 k8s 集群中,并通过 Ingress 将部署的服务暴露出来由外部访问。课程收获:-kubectl 命令的基本用法-使用 yaml 定义 k8s 资源的方法-ingress 的基本配置方法讲师/嘉宾简介李宇曈(遐宇)阿里云开发工程师,负责 ACK 上 Ingress 网关产品的研发和维护。

472 0
|
中间件 程序员 开发者
|

MSE企业版升级

讲师:流士(系统架构设计师)内容简介:1.MSE 微服务治理版图【MSE 治理热点功能回顾解析】2.流量防护完善【Sentinel 企业版全新升级,为您的应用提供全面流量防护】3.治理洞察升级【动态采集任意点位日志,轻松定位洞察偶现异常等棘手问题】4.产品化提升【管理不同环境的应用,控制不同子账号权限】

1136 1

Smart Metrics ——“智能,易用,效果可见”的Grafana智能告警插件

直播简介:Smart Metrics 是阿里云云原生团队Grafana平台上推出的一款智能告警插件,旨在为用户解决“告警配置难,误告警泛滥“的问题。那么Smart Metrics具体有哪些功能,又该如何使用呢?本期课程将为您揭晓答案。点击此处,前往官网了解更多Grafana相关信息!钉钉搜索群号:34785590,立刻加入阿里云Grafana服务群参与讨论~讲师/嘉宾简介陈昆仪,阿里云算法工程师

1265 0

可观测技术沙龙《微服务异常诊断与根因分析算法实践》

可观测技术沙龙(行业实践) 主题:《微服务异常诊断与根因分析算法实践》演讲人:刘贵阳 阿里云智能高级研发工程师

713 0

开源技术实践之可观测性数据采集与eBPF自动化

“可观测性技术实践系列”由云原生社区主办,云杉网络最为活动发起方,邀请阿里云iLogtal开源社区共同举办,本期聚焦“开源技术实践之可观测性数据采集与eBPF自动化”主题,DeepFlow和iLogtal一起分享各自在可观测性数据采集、处理、分析等方面的技术实践。讲师/嘉宾简介云杉网络 产品专家 李倩阿里云 技术专家 徐可甲 烨陌

788 57
|
运维 监控 应用服务中间件
|

使用Kubernetes监控定位Pod状态异常根因

Kubernetes Pod作为Kubernetes核心资源对象,不仅Service,Controller Workload都是围绕它展开工作,作为最小调度单元的它还担任着传统IT环境主机的职责,因此具有复杂的生命周期和依赖。因如此,绝大多数Kubernetes问题最终都会在Pod上表现出来,本节课将带来Pod常见异常场景解析以及定位根因最佳实践。

553 0
|
运维 监控 应用服务中间件
|

如何利用性能优化驱动用户体验提升

如果要票选五大最抓狂运维支撑场景,花样繁多的各种促销活动一定榜上有名。由于用户体验与网站性能造成的用户转化低、业务增长缓慢等糟糕结果,最终都会让运维工程师成为“众望所归”的背锅侠。那么,运维工程师如何拒绝成为背锅侠?本次直播为大家分享如何利用性能优化驱动用户体验提升,让您的产品实现健康增长。

418 0

云拨测全面升级|让网站测速、CDN优化更简单、更便宜

云拨测 2.0 全新上线,为您带来: (1)更丰富的监测点种类与覆盖范围 提供云主机、PC端、移动端监测点,覆盖国内外主流运营商。 (2)更多样的任务类型 支持网络质量、网页性能、文件传输(CDN)等任务类型。 (3)更便宜的使用成本 云主机监测最低仅需 0.001 元/次,全面压降拨测成本。 讲师/嘉宾简介 徐葛

616 1

RocketMQ直播课:5.0新版本可观测能力详解

● 可观测能力升级:Tracing链路追踪介绍RocketMQ的可观测能力,主要涉及Tracing的背景、设计和最佳实践。● 可观测能力升级:Metrics 指标分析介绍RocketMQ的可观测能力,主要涉及Metrics实现、指标定义、上报方式和最佳实践等。讲师文婷阿里云消息队列产品专家张森泽(玄珏)阿里云消息技术专家

481 0

基于 MSE 实现微服务的全链路灰度

本次实验提供了一个托管 MSE Ingress 网关集群和一个托管版 Kubernetes集群(用于 Demo 服务的部署)。 通过本场景的实验操作,您将掌握基于 MSE 微服务治理的,支持 MSE Ingres 网关、Spring Cloud、Dubbo 组件的微服务全链路灰度方案。 讲师/嘉宾简介 卜比(阿里云高级开发工程师)

445 0
|
运维 监控 程序员
|

《十万个可观测冷知识》—如何分析多个业务请求失败导致的用户业务操作失败

随着互联网成为生活必须品,用户在使用产品时经常需要填写表单或其他信息,其中是否能够成功提交成为非常关键的环节,那如何分析多个业务请求失败导致的用户业务操作失败呢?点击本视频,立即查看本期可观测的十万个冷知识~

714 2
|
运维 监控 程序员
|

《十万个可观测冷知识》—如何找到加载白屏时间过长的页面并定位根因?

在互联网高速发展的环境下,用户对于卡顿、白屏的忍受度也越来越低,那如何找到加载白屏时间过长的页面并定位根因呢?点击下方小视频,带你探究来自可观测的十万个冷知识~

968 57
|
运维 监控 前端开发
|

《十万个可观测冷知识》—如何识别单个用户在应用程序中的性能体验

随着网站、小程序成为生活必需品,用户体验成为重要话题。那么,如何识别单个用户在应用程序中的性能体验

872 0

可观测技术沙龙《More than Tracing Logging Metrics》

可观测技术沙龙(主会程)主题:《More than Tracing Logging Metrics》演讲人:吴晟Skywalking 创始人 & Apache基金会创世成员

387 0

云原生可观测性实践

【今日直播】—云原生可观测性实践时间:2/14 16:00本群内主讲嘉宾:垆皓 阿里云开发工程师内容简介:云原生架构给可观测性带来了新挑战,在微服务和容器化的背景下,如何快速定位并解决应用出现的问题?本次直播将会从基本的原理开始介绍,结合实际场景来讲述如何借助ARMS/Tracing Analysis来排查常规问题,在上述产品赋能下,让您诊断问题变得更轻松!

457 0

阿里云云原生全栈可观测实践—故障洞察提效 50%

直播介绍:(建议600字以内) 1、阿里可观测技术是如何从淘宝电商时代的APM发展演进到当下全栈观测的? 2、如何做好无侵入的数据采集技术? 3、如何通过智能告警来提醒告警配置效率? 4、观测数据存储&计算成本控制的有效策略有哪些? 5、全栈可观测实践案例分享。 讲师/嘉宾简介 曾国庆(悦达)|阿里云智能·技术专家,KubeVela 社区 Maintainer

981 3
|
架构师 程序员 开发者
|

深入浅出 OceanBase 线上技术沙龙

讲师:沙仟罚、周波、蔡飞志介绍:RocketMQ携手OceanBase,带来新年首期活动深入解读如何借助RocketMQ Connect构建数据流转处理平台,以及OceanBase在实时数仓的应用实践。

34081 2

可观测技术沙龙《Observability with Prometheus and beyond》

可观测技术沙龙(开源探索)主题:《Observability with Prometheus and beyond》演讲人:Richard HartmannGrafana Labs 亚太区首席解决方案工程师Éamon Ryan, Grafana Labs 首席现场工程师

418 0

可观测技术沙龙《More than Tracing Logging Metrics》

飞天club可观测技术峰会(主论坛)主题:《More than Tracing Logging Metrics》演讲人:吴晟

426 0

ARMS实践|日志在可观测场景下的应用-LiveTail

ARMS实践|日志在可观测场景下的应用-LiveTail

568 3
我要发布