1.知识图谱
知识图谱的广泛应用始于 Google 搜索服务。从此,知识图谱的数据输出能力得到拓展, 常见的是各类知识库。在运维领域,很多高阶的运维数据运用知识图谱,尤其是基于海量 数据的颗粒度关联和数据在聚合场景下的应用,通俗点说,基于运维的知识图谱是基于业 务连续性框架下的运维知识工程。
2.故障自动评估
故障自动评估有较多应用场景,如应急演练时快速规避盲测带来的风险,故障发生时 快速判断其对业务的影响。故障自动评估是基于运维知识图谱实现的。
3.无人值守变更
变更在运维领域是核心输出能力。在项目上线和产品投产环节,变更是最后一个步骤, 变更的成功与否至关重要。在运维领域无人值守变更并不是指没有人参与,而是指无须人 员过度参与。
4.动态阈值
动态阈值经常应用在高流量且突增突降的电商生态场景中,如数据源输出、支付、线 上抢购。此类生态系统的运维方式和普通的运维方式相比,存在诸多不同,如监控指标繁 多,动辄上万个监控指标,且配置复杂,一旦用户流量呈几何级增长,准确率和召回率断 崖式下降,同时会出现剧烈的报警“风暴”,噪音也呈几何级上升态势。因此,调整监控阈 值并不是一个好办法,只能通过数据挖掘或机器学习来实现阈值的自动调整。
故障处理包括 4 个阶段:故障发现、故障处理、故障恢复和故障总结,动态阈值是故 障发现的重要一环。
资料来源于《DevOps权威指南:IT效能“新基建”》
下载地址:https://developer.aliyun.com/topic/download?id=8246
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。