我们雇佣了一只大猴子...
Picture from Gremlin
我们“雇佣”了一只大猴子,只为“搞破坏”,不开玩笑。
这只猴子是用来做什么的?
从程序员的视角来看,提高系统稳定性的方法无外乎三种:
通过各种技术手段,例如在容器和调度、微服务、消息、软负载和配置中心等纬度提高系统和架构的健壮性;
提升监控的广度和深度,生产中一旦出现问题,能快速定位,给出解决方案;
生产就是大考,谁也不知道升学考中会出现什么样的试题,建立故障演练机制,把各类可以预见的故障提前演练出来,例如随机杀节点、延时响应,甚至中断机房;
这只猴子就是我们雇来做破坏,进行故障演练的队友。
秦王扫六合之阿里云架构设计
前言
自秦始皇横扫六国之后可以说是真正意义上的一统。然而云服务器能否在系统运维工程师手中完成一统,还需要我们不断的积累。秦王统一了货币 度量衡 统一了六国 也是励精图治的,所以设计一套合理的服务架构也需要拿出秦始皇的枭雄气质。
阿里云上数据统一备份 – 混合云备份服务解析
近年来,随着越来越多的企业从传统经济向数字经济转型,核心业务系统上云,云上的业务创新,这些都产生了大量的业务数据,这些数据也成为了企业最重要的资产、资源。阿里云混合云备份服务(Hybrid Backup Recovery, 简称HBR)可以为阿里云ECS,NAS,OSS上的文件,数据库以及自建机房内的文件,VMware虚拟机提供安全,高效的保护。