(1)基本和高级统计分析:单变量和多变量分析的组合,包括对跨 IT 实体捕获的 指标使用相关性、聚类、分类和外推分析,以及从监控数据源中对数据进行整理。 (2)自动模式发现和预测:使用上述一种或多种类型的历史或流数据,得出数学或 结构模式,描述可以从数据集本身推断但不会立即存在于数据集本身的新相关性;然后, 这些模式可用于及时预测具有不同概率的事件。 (3)应用异常检测:使用前一个组件发现的模式,首先确定构成正常系统的行为, 然后识别偏离该正常系统的行为。(4)根本原因确定:向下修剪由自动模式发现和预测组件建立的相关网络,以隔离 那些代表真正因果关系的依赖关系链接,从而提供有效干预的方法。 (5)规定性建议:对问题进行整理,将它们分类为已知类别;然后,挖掘以前解决 方案的记录,分析这些解决方案是否适用,并优先提供这些解决方案,以便尽早使用补 救措施;最终,使用闭环方法,并在使用后对其有效性进行表决。 (6)拓扑:对于 AIOps 检测到的具有相关性和可操作性的模式,必须围绕引入的 数据放置上下文,该上下文就是拓扑;如果没有拓扑的上下文和事实上的约束,检测到 的模式虽然有效,但可能毫无帮助且会分散注意力;拓扑中的数据派生模式将减少模式 的数量,建立相关性并说明隐藏的依赖关系;使用拓扑作为因果关系确定的一部分可以 大大提高其准确性和有效性;使用图形和瓶颈分析捕获事件发生的位置及其上下游的依 赖关系,可以提供关于将补救工作重点集中到何处的见解。以上内容摘自《应用智能运维实践(试读版)》电子书,点击https://developer.aliyun.com/ebook/download/367 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。