在面向终态的监控设计过程中,需要更加友好的面对监控对象和监控使用者,因此, 与普通监控不同的是,第三方数据的接入需要在服务目录范畴。在面向终态的服务目录设 计中,包括如下要求。
提供可视化的服务内容,使用更为便捷,降低了使用成本,提升了用户覆盖率, 把监控优先级提升至业务优先。
将第三方数据统一以服务中介的方式进行接入,服务中介采用箱即用方式对第三 方数据进行统一管理,如外接接口管理平台,对于接口的新增、删除,能够自动 进行统计、计算和分析。
服务中介将指定的服务提供给监控平台用户,并通过数据标签的方式自动进行关 联,根据实时、近线和离线方式进行处理,最终呈现给特定的标签用户。
监控平台用户可通过自定义方式接入可用的服务对象。
在数据处理方面,更偏重清洗和指标分层计算。其中,在清洗阶段,需要实时接收数据,并进行数据的处理、转换和清洗。任务一般 基于 Storm 或 Flink 实现,经过清洗任务处理后的结构化数据通过消息队列进行数据流转或 回流输出。在指标分层计算阶段,对结构化数据进行相关指标的计算,需要达到高吞吐量、 标准 SQL 等要求,还需要加强时间窗口、去重等功能的匹配。根据标签数据和标签用户的 不同特性,对数据动态地进行实时处理和离线更新。
在数据的回流输出方面,面向终态的监控平台需要根据监控目标不断地回检当前的系 统状态,从而为面向终态执行决策提供部分依据,因此,模型管道的构建必不可少。这也 是我们经常提到的异常检测功能。
对于异常检测,可以从告警分析和根因分析方面进行落地。在告警分析方面,基于系 统的面向终态需要实现,主要有对告警的时间顺序进行趋势分析;对指标对比进行分析, 降低指标预警的召回率;对已知的告警进行标记,辅助优化模型,间接提升指标预警的准 确率。在根因分析方面,通过数据的下钻和关联数据的收敛,根据最终的影响因素,对算 法分析出的根因进行判断和标记,通过根因判断的结果符合度指标来进行算法调优。
从本质上来说,面向终态继承了更先进的 DevOps 理念,通过运用大量的声明式 API 来提高“无条件”的极致用户体验水平,同时运用机器学习来加强数据的输出和变现能力。 这种设计方式将技术进行反向解耦,在服务能力的范围之内,将数据纳入用户体验中,提 升了数据的反馈能力,扩展了监控平台的用户范围,解决了运维数据运营中的一系列问题, 可以更加安全、稳定、高效和低成本地践行高效运维理念,是价值交付流水线中的重要组 成部分。
资料来源于《DevOps权威指南:IT效能“新基建”》
下载地址:https://developer.aliyun.com/topic/download?id=8246
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。