为什么故障应急是需要7*24H的应急值班机制,保证人工参与?
一方面是因为报警准确率无法达到100%,需要人工判断是否真实异常。另一方面各业务部门的故障标准存在差异,误发、漏发都会产生较大影响,故障需要人工确认发送。且故障处理过程需要人工组织跟进,应急争分夺秒,Oncall时效难以保障。
以上内容摘自《云上业务稳定性保障实践白皮书》电子书,点击https://developer.aliyun.com/ebook/download/7712可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。