开发者学堂课程【批量云资源管理与自动化运维:自动化运维的概念】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/512/detail/6838
自动化运维的概念
内容介绍
一、什么是自动化运维
二、运维自动化的三个阶段
三、如何实现自动化运维
四、阿里云 ROS 相较传统自动化运维(工具、方式、手段)的优势
一、什么是自动化运维
上节课主要讲自动化运维和阿里云 ROS 产品的基本目录,课程主旨。
针对课程目录进行具体的分析讲解。
传统运维由6部分组成:环境定义、部署、监控、告警响应、性能优化、SLA 保障
自动化运维与传统运维的区别,自动化运维主要分为5部分,以环境定义自动化为中心,所有运维都在一个大环境上。技术环境、网络环境所有运维部分都围绕环境设定。
环境定义自动化的基础上可以实现部署自动化、监控自动化、响应自动化、优化自动化。
自动化运维的基本构成:根据传统运维流程演变而来,各项采用自动化处理模式。主要目的提高时效性,降低成本性。
自动化的价值在将运维从繁琐的、例行、容易发生人为事故的工作中 脱离出来,人操作在某种意义上一定比机器自动化操作发生事故率大得多,不管是脚本还是程序化都按照设定去实施、应用。如果脚本、设备没有问题一般情况下不会出现错误率,做更有价值的业务运维和服务运维就是自动化运维。
二、运维自动化的三个阶段
操作自动化
把运维一系列的手工执行的操作,用脚本或工具简单串起来,更加高效快速且故障率降低
场景自动化
工具会根据外部环境判断如何运行,比操作自动化上升一步是阶梯状的,操作自动化需要手动操作,场景自动化脚本、工具或应用会根据场景的变化而变化。判断条件是事先运维定义好的,需要人工设定,设定好后会按照设定的参数推下去。
智能化
具备数据核心,具备根据数据自己分析和判断、并自我决策和执行的能力。推广很普及的包括人工智能化、工具智能化、模块智能化是流行的趋势。
三、如何实现自动化运维
有三个阶段
1.先解决痛点
·日常工作中,对常见问题进行分类和梳理,能做成工具的就工具化,能程序化操作的,就避免人为干预,可以大大减少部署故障率、实施故障率。
2. 正确的阶段
·手动支撑,所有参数、部署环节目前都需要手动标定。
·线上标准规范化,做到某一步要有标准化,什么是对的,哪样做会回滚,怎样做是错的会终止。
·运维工具化,运维工具化已经普及。很多自动化运维软件,监控类的 Zabbix, 部署类的 Ansible 都是开源免费的。
·平台自动化,包括阿里云 ROS 是自动化的大平台
3.原子件 & 复合件
为了解决痛点而搭建的运维自助部署平台,平台基于标准化 /CMDB 部署的高大上运维自动化平台,可以共存。可以做自动化部署,同时可以分析一些痛点自动化分析。
四、阿里云 ROS 相较传统自动化运维(工具、方式、手段)的优势
运维出身的人提到自动化运维觉得工具设定很麻烦,部署不是一般有运维经验的人能部署完的,涉及到开发的东西。
很多运维同仁实施运维自动化时,想谋求设计一个完备的系统,来自动化完成几乎所有运维工作,又被复杂程度所困惑、踌躇不前。
在思考怎样做运维自动化之前,相信一句话:企业的架构不是设计出来的,是一步一步通过不断完善演变而来的,此需求才是最正确的需求。客户不断摸索出来的最终需求才是真的需求。非常高端的架构师设计出的平台、架构并不是公司所需要的,也许过剩、也许不够。
不管是架构还是任何设计都应该按照真正的需求而慢慢演变推算而来。
传统运维和 ROS 的优劣
传统自动化运维操作复杂,需要准备的工具和步骤繁琐
ROS 生在云上,更容易针对云资源进行部署、运维。