5.3.4故障演练与紧急预案设计
在做完前面三步之后,由于平台网站随着时间发展一定会有多次的迭代,为了确
保迭代之后同样可以保障平台的稳定性,需要定期进行故障演练来提高故障敏感和应
急解决的速度,以对之前做的稳定性保障工作进一步验证,确保及时得到有效的稳定
性提升。演练的目的是为了发现问题,从而解决问题。
•故障演练应制定一套标准流程,以及相应的预期和目标。
•故障演练的影响范围是可控的。
•故障演练暴露的问题解决后必须验证。
•定期进行故障演练,需要有总结和沉淀,提高故障敏感度以及故障响应解决的
速度。