基于Tag的自动化监控方案

本文涉及的产品
云监控,每月短信1000条
简介: 简介: 关键词: 云监控,Tag,分组,应用分组,自动监控,redis监控,cloudmonitor-group,自动发现 随着企业云资产越来越多,每天生产销毁变更的资源也不在少数,企业用户对这些资产的管控难度也越来越大,尤其是监控领域。

打个Tag就完成监控了?--使用监控的新姿势

关键词:

云监控,Tag,分组,应用分组,自动监控,redis监控,cloudmonitor-group,自动发现

背景

随着企业云资产越来越多,每天生产销毁变更的资源也不在少数,企业用户对这些资产的管控难度也越来越大,尤其是监控领域。每生产或者销毁一个实例,就要人肉为其配置管理相关监控报警,这需要非常大的人肉管控成本,直接block了用户使用云监控,从而给用户的可用性带来威胁。

随着的TAG的成熟,很多企业开始使用TAG来实现资源的分类、运维、财账等。基于TAG的运维监控,也是其中非常重要的一个场景。因此tag和云监控打通,将能够实现基于TAG的自动化监控,只要用户打上tag,就能够自动设置上相应的监控,是很多大用户非常期待的,这将有助于用户大大降低监控管理成本。

先满足,让用户资源能够被监控到这样一个最基本的诉求。

方案

云监控中有应用+应用分组的资源管理模型,可以实现跨region,跨产品的资源监控管理。同时,基于应用分组+监控模板,可以对一组资源快速实现监控覆盖,甚至是自动化监控。

然而,对于大用户来说,以头条为例,大几万的资源,对这些资源的分组也达到几千个,如果这些资源是通过人肉方式创建,几乎是不可想像的。好在一些用户已经通过tag,将这些资源作好了分组。我们需要做的是,将这些分组自动对应到云监控的应用分组,自动的带上监控。

综上,tag和云监控打通将给用户带来极大的便利。

详解

目前云监控和TAG服务集成,支持了两种通过TAG完成监控的方式,来满足不同用户的需求:

一,给资源打下固定的Tag键:cloudmonitor-group

这个tag键对应的所有值,都会自动创建一个云监控的应用分组,在分组中可以提供资源使用率的图表,以有分组维度的监控管理。

image

如上图所示,一共创建了两个TAG,一个Key:cloudmonitor-group value:为空,另一个key:cloudmonitor-group,value:test。
两个tag的value分别创建了一个监控的应用分组,创建分组时,默认使用的监控模板名为:‘’常用基础模板“,默认使用的报警联系人组为:”云账号报警联系人“。

分组创建完成后,用户可以根据需要,手动修改监控模板和报警联系人。

二,通过指定的TAG key来完成监控:

登录云监控控制台,在应用分组菜单中创建应用分组:
image

image

如图:可能通过指定的tag key来创建分组, 并支持过滤指定的tag值,如需要把tagkey=owner,tagvalue包含“开发”的所有tag值创建分组。
image

同样,默认使用的监控模板名为:'常用基础模板',默认使用的报警联系人组为:'云账号报警联系人'。

用户可以根据需要,手动修改监控模板和报警联系人。

另外,目前云监控也支持按实例的名称来实现对资源的自动发现,比如创建一个分组,将名称中包括'dev'的实例自动加入分组,

总结:

使用TAG和名称动态匹配的方式的好处是,创建一个分组后,以后创建的所有符合条件的实例,都会自动发现自动加入分组,自动被监控,从而大大降低监控配置的成本。

  1. 目前Tag监控,只支持ecs(只支持实例,不支持网卡,磁盘等),rds,slb,redis四款产品,其他产品还需要再等待一段时间。
  2. 目前一个分组里每个产品,最多只能支持3000个资源。超过3000个,不会加入分组中,顺序是随机。
  3. 创建完分组,分组聚合的监控数据,需要等待5分钟左右的时间,才会看到分组级别的数据图表。
  4. 创建完分组,具体的分组以及分组里的报警规则,会在后台异步创建,所以也会有几分钟的延迟。
  5. 目前基于TAG创建分组都是通过订阅tag键的方式实现的,因此,后续这个tag键新创建的值,只要满足规则匹配条件,就会自动创建出一个分组。
  6. 分组名称的规则是:TagKey-TagValue-1,用户可修改。

后续计划:

云监控的分组会继续和资源组,财务单元等企业管理方式打通,提供更多的监控视角和资源使用率视角。
同时,也会支持按分组进行授权,以帮助企业完成精细化管理的需求。

关联阅读

Tag监控: https://yq.aliyun.com/articles/740089?spm=a2c4e.11153940.0.0.2cc48cafsTfmrz
redis的自动化监控:https://developer.aliyun.com/article/742445?spm=a2c6h.13148508.0.0.e1364f0eViWuKT

相关实践学习
基于云监控实现的监控系统
通过阿里云云监控功能给非阿里云主机安装监控插件,从而实现对非阿里云主机的各项指标进行监控和管理,在配置报警规则和报警人的情况下,能对特定的场景做出报警反应通知到报警人的手机上。
目录
相关文章
|
11天前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
4天前
|
存储 运维 监控
构建高效运维体系:从监控到自动化的全方位实践指南
在当今数字化时代,企业对运维(Operations)的需求日益增长。运维不仅仅是保持系统运行那么简单,它涉及到监控、日志管理、故障排除、性能优化和自动化等多个层面。本文将从实际操作的角度出发,详细探讨如何构建一个高效的运维体系。通过具体案例,我们将了解不同运维工具和方法的应用,以及它们是如何帮助企业提高生产效率和降低运营风险的。无论你是刚接触运维的新手,还是经验丰富的专家,这篇文章都将为你提供宝贵的参考和启示。
|
2天前
|
运维 监控 安全
构建高效运维体系:从监控到自动化的全方位实践
本文深入探讨了构建高效运维体系的关键要素,从监控、日志管理、自动化工具、容器化与微服务架构、持续集成与持续部署(CI/CD)、虚拟化与云计算以及安全与合规等方面进行了全面阐述。通过引入先进的技术和方法,结合实际案例和项目经验,为读者提供了一套完整的运维解决方案,旨在帮助企业提升运维效率,降低运营成本,确保业务稳定运行。
|
29天前
|
测试技术 Linux 虚拟化
iOS自动化测试方案(五):保姆级VMware虚拟机安装MacOS
详细的VMware虚拟机安装macOS Big Sur的保姆级教程,包括下载VMware和macOS镜像、图解安装步骤和遇到问题时的解决方案,旨在帮助读者顺利搭建macOS虚拟机环境。
46 3
iOS自动化测试方案(五):保姆级VMware虚拟机安装MacOS
|
29天前
|
测试技术 开发工具 iOS开发
iOS自动化测试方案(三):WDA+iOS自动化测试解决方案
这篇文章是iOS自动化测试方案的第三部分,介绍了在没有MacOS系统条件下,如何使用WDA(WebDriverAgent)结合Python客户端库facebook-wda和tidevice工具,在Windows系统上实现iOS应用的自动化测试,包括环境准备、问题解决和扩展应用的详细步骤。
63 1
iOS自动化测试方案(三):WDA+iOS自动化测试解决方案
|
5天前
|
存储 运维 监控
构建高效运维体系:从监控到自动化的全方位实践
在当今信息技术飞速发展的时代,运维作为保障信息系统稳定运行的关键环节,其重要性不言而喻。本文将围绕如何构建一个高效的运维体系进行深入探讨,内容涵盖从监控、日志分析到自动化运维工具的选择与应用,以及在实际工作中的经验和案例分享。通过本文的介绍,读者将能够了解到如何在复杂多变的技术环境中,确保系统的高可用性、高性能和安全性,为业务连续性提供坚实保障。
|
29天前
|
测试技术 数据安全/隐私保护 iOS开发
iOS自动化测试方案(四):保姆级搭建iOS自动化开发环境
iOS自动化测试方案的第四部分,涵盖了基础环境准备、iPhone虚拟机设置、MacOS虚拟机与iPhone真机的连接,以及扩展问题和代码示例,确保读者能够顺利完成环境搭建并进行iOS自动化测试。
61 0
iOS自动化测试方案(四):保姆级搭建iOS自动化开发环境
|
29天前
|
测试技术 虚拟化 iOS开发
iOS自动化测试方案(二):Xcode开发者工具构建WDA应用到iphone
这篇文章是iOS自动化测试方案的第二部分,详细介绍了在Xcode开发者工具中构建WebDriverAgent(WDA)应用到iPhone的全过程,包括环境准备、解决构建过程中可能遇到的错误,以及最终成功安装WDA到设备的方法。
84 0
iOS自动化测试方案(二):Xcode开发者工具构建WDA应用到iphone
|
29天前
|
测试技术 开发工具 虚拟化
iOS自动化测试方案(一):MacOS虚拟机保姆级安装Xcode教程
这篇文章提供了一份保姆级的教程,指导如何在MacOS虚拟机上安装Xcode,包括环境准备、基础软件安装以及USB扩展插件的使用,以实现iOS自动化测试方案的第一步。
27 0
iOS自动化测试方案(一):MacOS虚拟机保姆级安装Xcode教程
|
20天前
|
数据采集 运维 监控
自动化运维:用Python打造简易监控系统
【8月更文挑战第31天】在追求高效的IT世界里,自动化运维不再是奢侈品而是必需品。本文将通过一个Python示例,展示如何构建一个简单的系统监控工具。从数据采集到警报触发,我们将一步步解锁自动化的秘密,让你的服务器管理变得轻松而高效。

热门文章

最新文章