容器监控与分析实践(一)| 学习笔记

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 快速学习容器监控与分析实践。

开发者学堂课程【DevOps 日志分析实战 :容器监控与分析实践(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/736/detail/13101


容器监控与分析实践(一)

 

内容介绍:
一、构建全方位 Kuberneters 监控。

二、基础指标监控-Prometheus的前世今生

三、基础事件监控-Kubernetes事件中心

四、部署Prometheus 监控操作与演示

 

本节主要内容是容器监控与分析实践,涉及到容器部分可以想到容器编排领域的实时的标准 Kuberneters 。在本节中主要是学习如何构建全方位 Kuberneters 监控。

 

一、构建全方位 Kuberneters 监控。

1.Kuberneters 的好处

比如容器编排、弹性伸缩、负载均衡、快速发布、负载均衡、高可靠、无人值守、异常自动恢复、高效运维等等。

对于运维人员来说,Kuberneters 能够帮助快速构建监控、做高效的运维,例如异常自动恢复等等。

在真实的场景下,Kuberneters 也会遇到问题,Kuberneters 并不是帮助将所有的监控、运维、各种异常恢复等等完成,更多是提供一个平台,该平台能够帮助更快速发布,更快的完成弹性伸缩、更容易的完成其观察。所以 Kuberneters 会遇到各种各样的问题,对于操作者要做的是构建一个全方位的监控、知道应用哪个位置挂了、为什么挂了,挂了后如何去恢复。

2.Kuberneters 监控架构

image.png

在开发 S 上分为多个层次,包括基础设施、ServiceMesh 层(如果有 ServiceMesh)、网关接入层、业务层(内部指标)。

基础设施主要包括 CPU 、内存等一些机器级指标和容器级指标(包括 CPU 内存消耗、容器是否重启、容器的网络磁盘 io等等 ),还有一部分是 Events 信息,该部分K8s Events 是 K8s API Server,相当于目前 K8s 发生哪些重要的事件。该部分主要依赖于 Metrics,也就是监控指标,比如 cpu 曲线、内存曲线等等,Metrics 主要依赖 Prometheus 进行监控。ServiceMesh 的一部分和 Metrics 相关,包含链路式追踪的一些数据(该部分数据可以用 Metrics 来做)。接入层该部分主要用 K8s 的 Ingress,K8s 的 Ingress作为整个 K8s 的流量路口,该部分的监控也非常重要,Ingress 一般情况下采用 Nginx 的 Ingress controller,所以更多是基于 Nginx 的访问日志去做各种各样的监控、各种各样的站点、后端的响应延时等等。业务层更多依赖于业务日志监控,包括业务日志中的存储信息以及从业务日志中提取关键性的指标去做异常的检测和判断。

所有这些都是通过 SLS (也就是日志服务)都可以轻松实现。

从业务价值上说,对业务监控是最有效的;从覆盖面来说,基础设施的覆盖面相对来说更广。搭建应该是从下到上。

3.DevOps 数据中台架构

从 DevOps 的角度来说,SLS 扮演一个数据中台的架构,数据中台支持从各种各样的地方把各种类型的 DevOps 要用到的数据(包括日志、链路追踪的数据、指标数据),能够从各种数据源(例如容器、移动端、ROT)将数据采集,采集后支持数据分析(数据分析的方式包括 circle92的语法等等)和智能的算法(智能的聚类、智能的预测等等),向上提供一些可视化的组件帮助将这些数据展现出来,也提供一些告警通知、Webhook,帮助做一些辅助的角色。

image.png

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
2月前
|
Kubernetes Cloud Native Docker
云原生时代的容器化实践:Docker和Kubernetes入门
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术成为企业提升敏捷性和效率的关键。本篇文章将引导读者了解如何利用Docker进行容器化打包及部署,以及Kubernetes集群管理的基础操作,帮助初学者快速入门云原生的世界。通过实际案例分析,我们将深入探讨这些技术在现代IT架构中的应用与影响。
134 2
|
1月前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
19天前
|
存储 人工智能 调度
容器服务:智算时代云原生操作系统及月之暗面Kimi、深势科技实践分享
容器技术已经发展成为云计算操作系统的关键组成部分,向下高效调度多样化异构算力,向上提供统一编程接口,支持多样化工作负载。阿里云容器服务在2024年巴黎奥运会中提供了稳定高效的云上支持,实现了子弹时间特效等创新应用。此外,容器技术还带来了弹性、普惠的计算能力升级,如每分钟创建1万Pod和秒级CPU资源热变配,以及针对大数据与AI应用的弹性临时盘和跨可用区云盘等高性能存储解决方案。智能运维方面,推出了即时弹性节点池、智能应用弹性策略和可信赖集群托管运维等功能,进一步简化了集群管理和优化了资源利用率。
|
1月前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
1月前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
2月前
|
安全 持续交付 Docker
深入理解并实践容器化技术——Docker 深度解析
深入理解并实践容器化技术——Docker 深度解析
86 2
|
2月前
|
Prometheus 监控 持续交付
深入理解Docker容器化技术:从基础到实践
深入理解Docker容器化技术:从基础到实践
|
2月前
|
安全 Docker 微服务
深入理解Docker容器技术:从基础到实践
深入理解Docker容器技术:从基础到实践
|
2月前
|
Kubernetes Cloud Native Docker
云原生技术探索:容器化与微服务的实践之道
【10月更文挑战第36天】在云计算的浪潮中,云原生技术以其高效、灵活和可靠的特性成为企业数字化转型的重要推手。本文将深入探讨云原生的两大核心概念——容器化与微服务架构,并通过实际代码示例,揭示如何通过Docker和Kubernetes实现服务的快速部署和管理。我们将从基础概念入手,逐步引导读者理解并实践云原生技术,最终掌握如何构建和维护一个高效、可扩展的云原生应用。
|
2月前
|
Cloud Native 持续交付 Docker
Docker容器化技术:从入门到实践
Docker容器化技术:从入门到实践