云原生可观测性的现状、搭建方法和发展趋势

本文涉及的产品
应用实时监控服务ARMS - 应用监控,每月50GB免费额度
可观测可视化 Grafana 版,10个用户账号 1个月
可观测链路 OpenTelemetry 版,每月50GB免费额度
简介: 云原生可观测性的现状、搭建方法和发展趋势

当下 BAT、美团、字节跳动等一线大厂都在加速推进业务的容器化、云原生化。打开这篇文章的你,应该或多或少跟云计算、容器、Kubernetes、云原生应用有过接触。

在这样的背景之下,很多问题成了开发、测试、运维同学的家常便饭:

  • 某个新版本发布上线之后,发现主机的 CPU 使用率持续飙高,但不知道根本原因在哪,只能根据过往的经验一一排查;
  • 新版本上线之后,很难判断功能是不是完全正常,只能等着用户找客服投诉之后,才知道哪个模块出现了报错;
  • 基础设施方面,通过监控搞了一大堆稀奇古怪的仪表盘,看着花花绿绿一大片,可是又不能反映出业务的真实情况,也不能跟随业务的变化而灵活调整。

局面混乱,效率又不高。可以说,监控,被架到了一个不得不自己命的位置。而可观测性(Observability)就是解决这些问题的关键。

甚至,Gartner 在 2022 年度的基础设施和运维自动化技术成熟度周期图里,把“可观测性”放在膨胀期波峰最顶端位置,可以说是风头正盛。

可观测性适用于任何关心代码在生产环境中的运行质量的人。它可以监测和解决生产系统中复杂而新颖的问题。具体到岗位上:可观测性能够架起开发人员和运维人员构建合作的桥梁:运维人员使用它来发现问题,给故障现场提供足够的数据让开发人员进行分析,而开发人员可以使用它来指导运维人员定位问题,并使用工具来质疑和验证假设。此外,测试、DevOps 工程师、SRE 工程师等角色都可以了解和学习可观测性,以此提高产品质量和服务可靠性。

如何学习可观测性?

虽说,可观测性是云原生一个绕不开的话题,但是可观测性到底指的是什么?效果又是否真的能达到预期?到底是自建可观测性平台还是直接购买比较好?如何搭建可观测平台?……网上关于上面的疑惑的解答很多,但资料非常驳杂没有真正成体系化的知识。繁杂的数据中快速提炼有用的数据,高效解决可观测性的问题,是非常难的。在这里给大家推荐观测云的产品技术总监翁一磊总结的「可观测性学习路径」上图内容来自,他在极客时间开设的新专栏《深入浅出可观测性》



为什么说翁一磊能讲好可观测性?

翁一磊,观测云的产品技术总监,主要负责售前技术和客户服务工作。他曾经就职于微软、HP、Dell EMC 等外企,从最初的技术支持,到售前以及项目交付,再到解决方案集成与验证,相关的工作可以说是做了一圈。从外企出来之后,他负责过多云管理产品计算机软件领域的可观测性,在国外是在 2018 年左右提出的,现在已经有了不少玩家,比如久负盛名的 DataDog;而国内是在今年,可观测性才成为热门话题的。

近几年的观察让他意识到,很多时候人们只是把原来传统的监控换了一个壳子,变成了可观测性。正所谓新瓶装旧酒,但其实这并不是真正意义上的可观测性。而为了矫正这种观点,看清可观测性的本质和价值,他结合自己在这一领域多年的经验和思考,带你直抵可观测性的内核,合理、高效地部署可观测平台。

这门专栏是如何设计的?

在这个可观测性的课程中,他会从下面几个方面为你展开讲解:

概念篇:为了更好地理解可观测性,首先带你理一理监控的发展历程。接着,他会详细解读可观测性相关的基本概念,包括你可能经常听到的可观测性三支柱。之后带你一起辨析可观测性和传统监控的区别。

基础篇:他会首先介绍一下 OpenTelemetry ,这是目前可观测领域非常成熟和热门的标准和规范,在此基础上,带你进一步了解如何实现和建立非某个供应商锁定的可观测性。接下来,还会给你分析购买或自己搭建可观测性的利弊,拥有全局观念,在有需求的时候理智下判断。实战篇:这部分是专栏的重头戏,毕竟可观测性最重要的目标,就是保障系统和应用的服务可靠性。这个模块,会讲到队协作,可观测驱动的开发,建立、跟踪SLO等话题,然后他会选取微服务架构的系统,带你搭建起这个系统的可观测性,让你在动手操练的过程中更好地掌握可观测性,并能够通过可观测性来分析和解决问题。总结与展望篇:讲述如何构建可观测性的文化和框架,让你了解在企业中推广可观测性需要优先考虑的关键能力。还会给你介绍可观测性未来的发展趋势。 接下来,我们通过目录来看看具体内容吧:

相关文章
|
6月前
|
Kubernetes 监控 Cloud Native
全栈声明式可观测:KubeVela开箱即用且灵活定制的云原生应用洞察
KubeVela 是一个开箱即用的现代化应用交付与管理平台。本文我们将聚焦 KubeVela 的可观测体系,介绍云原生时代的可观测挑战及 KubeVela 的解决方案。
|
4月前
|
存储 监控 Cloud Native
kubevela可观测体系问题之KubeVela云原生时代可观测性挑战的问题如何解决
kubevela可观测体系问题之KubeVela云原生时代可观测性挑战的问题如何解决
|
5月前
|
弹性计算 监控 Cloud Native
构建多模态模型,生成主机观测指标,欢迎来战丨2024天池云原生编程挑战赛
本次比赛旨在如何通过分析 ECS 性能数据和任务信息,综合利用深度学习、序列分析等先进技术,生成特定机器的性能指标。参赛者的解决方案将为云资源管理和优化决策提供重要参考,助力云计算资源的高效稳定运行和智能化调度。
648 16
|
6月前
|
自然语言处理 监控 Cloud Native
对话阿里云云原生产品负责人李国强:推进可观测产品与OpenTelemetry开源生态全面融合
阿里云宣布多款可观测产品全面升级,其中,应用实时监控服务 ARMS 在业内率先推进了与 OpenTelemetry 开源生态的全面融合,极大丰富了可观测的数据类型及规模,大幅增强了 ARMS 核心能力。本次阿里云 ARMS 产品全面升级的背景是什么?为什么会产生围绕 OpenTelemetry 进行产品演进的核心策略?在云原生、大模型等新型应用架构类型层出不穷的今天,又将如何为企业解决新的挑战?阿里云云原生应用平台产品负责人李国强接受采访解答了这些疑问,点击本文走进全新升级的阿里云可观测产品。
42019 14
|
5月前
|
人工智能 监控 Cloud Native
多款可观测产品全面升级丨阿里云云原生 5 月产品月报
多款可观测产品全面升级丨阿里云云原生 5 月产品月报。
|
5月前
|
Cloud Native 持续交付 云计算
探索云原生技术的未来发展趋势
随着云计算技术的不断演进和发展,云原生技术已成为当今软件开发领域的热门话题之一。本文将深入探讨云原生技术的定义、特点以及未来发展趋势,为读者提供对这一领域的全面了解和展望。
186 2
|
6月前
|
边缘计算 运维 Cloud Native
探索云原生技术的未来发展趋势
随着数字化时代的不断深入,云原生技术已成为企业数字化转型的重要支撑。本文将探讨云原生技术的定义、特点以及未来发展趋势,重点关注容器化、微服务、自动化运维等方面,展望云原生技术在未来的发展方向与挑战。
115 1
|
6月前
|
边缘计算 运维 监控
探索云原生技术的未来发展趋势
云原生技术作为当今IT行业的热门话题,正在以前所未有的速度迅猛发展。本文将从多个方面探讨云原生技术的未来发展趋势,包括边缘计算、容器化、自动化运维等方面的创新与应用,展望云原生技术的发展前景。
43 0
|
6月前
|
Cloud Native 持续交付 云计算
探索云原生技术的未来发展趋势
云原生技术作为当今IT领域的热门话题之一,正受到越来越多企业和开发者的关注和追捧。本文将从云原生技术的定义、发展历程以及未来发展趋势等方面展开深入探讨,分析其在未来的应用前景和发展空间,帮助读者更好地了解云原生技术的重要性和潜力。
50 0
|
6月前
|
存储 Prometheus 运维
【阿里云云原生专栏】云原生下的可观测性:阿里云 ARMS 与 Prometheus 集成实践
【5月更文挑战第25天】阿里云ARMS与Prometheus集成,为云原生环境的可观测性提供强大解决方案。通过集成,二者能提供全面精准的应用监控,统一管理及高效告警,助力运维人员及时应对异常。集成示例代码展示配置方式,但需注意数据准确性、监控规划等问题。这种集成将在云原生时代发挥关键作用,不断进化以优化用户体验,推动业务稳定发展。
224 0