如何通过 SLI 和 SLA 来度量 Flink 集群的稳定性?
通过定义 Flink 作业状态(调度中、运行正常、运行异常)作为 SLI(Service Level Indicator),计算异常作业的比例来度量集群的可用性。SLA 可用率通过 SLA 异常数和平均每次异常时长计算得出,公式为 SLA 可用率 = SLA 异常数 * SLA 平均每次异常时长。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。