大规模 ECS 出现 CPU 负载异常导致业务整体不可用,如何处理?
处理方案 • 提前预案 根据阿里云提供全链路评估报告梳理 ECS 安全组规则,收敛存在安全风险 的策略,如收敛 0.0.0.0/0 规则。 核心业务服务器请安装安骑士,及时修补服务器安全风险及漏洞。
• 恢复预案 登录异常 ECS,通过 TOP 命令看看是否存在陌生进程占用大量 CPU,判断 有可能被暴力破解并部署挖矿程序,需要及时切彻底删除木马程序。 如业务进程占用 CPU 最高,可尝试重启应用优先恢复业务。 通过快照进行恢复到之前的状态。
以上内容摘自《企业运维之弹性计算原理与实践》电子书,点击https://developer.aliyun.com/ebook/download/7779 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。