ARMS 强大的告警和分级响应机制为我们带来了哪些便利?
• 告警模板全球生效功能:只需配置一次告警规则,即可使不同的集群生效告警 规则。比如没有告警模板时需要对每个 cluster 里的指标单独配置告警。而有了 模板后,只需通过告警规则模板的方式将 PromQL 或告警的 AlertRule apply 到 全球各个 region 集群,非常方便;
• 告警排班表和动态通知:系统能够动态实现轮班替班工作,比手工排班更靠谱;
• 事件处理流和告警富化:可以通过 ARMS 的事件处理流、告警中心的事件处理 流和告警富化功能,在告警触发后动态地打上标记,并且做分级处理。如上图, 可以给告警打上优先级标签,优先级较高的告警等级升级为 P1,并且可以动态 地修改告警接收人;
以上内容摘自 《2021 阿里云可观测技术峰会演讲实录合辑(上)》 电子书,点击https://developer.aliyun.com/ebook/download/7763 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。