ECS主动运维专栏(1):从On-Premise本地化运维到On-Cloud云上运维的演进

简介: 从用户的声音中,我们听到用户对稳定、弹性、透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行。为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务。

阿里云经过9年多的发展,成长为中国第一全球前三的云服务提供商,为上百万用户提供IT基础设施云服务。这些用户几乎都会使用ECS弹性计算服务,这其中既有面向消费者(to C)、企业(to B)提供服务的互联网应用、电商、娱乐等类型的用户,也有面向企业内部效率提升搭建信息化数字化平台和应用的用户,还有广泛的个人网站、开发者等,不论哪种类型的用户,从购买创建第一台ECS云服务器开始,就已经进入了云上使用和运维的阶段。


与传统IDC环境相比,云上运维有哪些差异?大量的计算资源怎样方便快捷地部署、管理?如何发挥弹性响应业务负载变化的同时保持较低TCO总拥有成本?ECS出现异常是什么原因,如何保持业务连续性?……等等这些,是很多用户在使用和运维ECS过程中提出的问题。从用户的声音中,我们听到用户对稳定、弹性、透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行。为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务。


a1bfacc64030ca54e850ce0245459940d23a9f9b


今天,我们先来聊聊从On-Premise本地化运维到On-Cloud云上运维的演进历程。


On-Premise本地运维

在互联网服务和云计算兴起之前,IT技术多是为企业内部的信息化服务,而企业的IT能力多建设在On-Premise本地部署基础之上。企业基于其公司战略、运营模式、流程体系、组织架构等业务发展需要和特点设计对应的IT架构,通过建设自有数据中心或租用第三方IDC构建IT基础设施资源,在此基础上搭建应用系统,支持企业的发展。相应地,企业IT组织会设立开发、运维等职能的团队,以满足业务发展变化的需求和业务连续性的保障。


早期的IT设计多为企业内部信息化的需要服务,通过引入ERP、MRP、MES、PLM、CRM等商业软件,优化企业业务流程,提升企业运营效率。由这些商业软件解决方案的技术架构所决定,对应的基础架构多以商业数据库、小型机等专有服务器、光纤连接的存储区域网络(SAN)、存储阵列、磁带库等为主,这类基础架构组件以集中度高、单体稳定性强、纵向扩展为显著特点,通过单机扩展提升处理能力,实施技术难度较大,周期较长,管理复杂度较高,因而逐渐形成了以ITIL为最佳实践的运维管理体系,注重流程规范和控制风险。


随着互联网的发展和企业通过互联网与其客户紧密连接的需要,支撑企业对外服务客户的IT设计也逐渐发展和成熟,通过广泛应用开源软件,建立企业对客户的电子商务、社交网络、数据分析等能力,优化用户体验,提升客户价值。由这些开源软件解决方案的技术架构所决定,对应的基础架构多以开源数据库、X86通用服务器、本地块存储、对象存储、数据以太网络为主,这类基础架构组件以分布式部署、集群架构、横向扩展为显著特点,通过向集群增加节点扩展处理能力,实施随业务的快速变化而定,周期较短,方案组合灵活,因而逐渐形成了以DevOps为最佳实践的运维管理体系,注重效率敏捷和快速响应业务需求。


两种典型运维管理体系都会建立基础运维和应用运维团队,且由于初始投资较大,影响范围广泛,企业会格外重视硬件投资和基础运维工作,并安排经验丰富的基础运维工程师维护数据中心、服务器、存储、网络等硬件和软件工作。由于基础设施资源有限,设备采购、部署实施和调整周期较长,因而运维团队会设立一系列制度和流程,管理和控制资源的使用以及容量规划。


On-Cloud云上运维

云计算的兴起,为企业建立有竞争优势的IT能力提供了更强的支撑。企业IT组织利用云计算提供的按需自助服务、资源池化、弹性扩展伸缩、广泛网络连接等服务特性,进一步提升企业信息化和数字化能力,在快速变化的行业环境和日趋激烈的市场竞争中脱颖而出。


在企业IT组织中,不论其运维体系是以注重流程和管控的ITIL理念还是以注重效率和敏捷的DevOps理念为核心,面对On-Cloud的趋势,不变的始终是保持对业务需求的响应和对系统可靠性业务连续性的保障。而借助云计算的诸多特性和优势,企业运维的重心从重视面向基础环境的运维转向重视面向业务应用的运维,更有效地支撑企业战略和业务发展。在架构层面,借助云计算广泛多样的产品和服务,企业IT架构从竖井式向共享服务式发展,通过水平分布的系统架构实现对可用性的保障,并提升弹性扩展的能力,数据的流转提升对业务的洞察。同时,借助云计算资源池化、监控和编排等能力,IT运维组织对资源的使用和容量规划可以与业务变化及研发需求更紧密灵活地结合,从管控模式向服务模式转变;API、SDK的广泛使用使基础设施可编程,自动化的部署和编排进一步促进环境准备、灰度发布、在线变更的效率。


在互联网企业中,由于天生就需要面对大流量高并发的业务需求,往往从第一天搭建开始就已经采用了Cloud Native或Cloud Friendly的系统架构和运维方式。随着公有云服务的发展和成熟,互联网服务普遍采用All on 公有云或混合云的部署结构,会更适应On-Cloud云上运维形态,运维的重心保持在如何支撑快速发展变化的业务规模,弹性响应业务波动,快速高效地管理大规模海量资源等方面。


综上所述,云上运维向更自动、更敏捷、更弹性的趋势演进,但本质始终是赋能业务永续运行,助力企业战略目标和业务发展的实现。下一期,我们会在此基础上聊一聊如何在阿里云上建立云上IT运维能力。

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
29天前
|
运维 应用服务中间件 网络安全
自动化运维的新篇章:使用Ansible进行服务器配置管理
【10月更文挑战第34天】在现代IT基础设施的快速迭代中,自动化运维成为提升效率、确保一致性的关键手段。本文将通过介绍Ansible工具的使用,展示如何实现高效的服务器配置管理。从基础安装到高级应用,我们将一步步揭开自动化运维的神秘面纱,让你轻松掌握这一技术,为你的运维工作带来革命性的变化。
|
2月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
79 2
|
8天前
|
运维 Ubuntu 应用服务中间件
自动化运维之路:使用Ansible进行服务器管理
在现代IT基础设施中,自动化运维已成为提高效率和可靠性的关键。本文将引导您通过使用Ansible这一强大的自动化工具来简化日常的服务器管理任务。我们将一起探索如何配置Ansible、编写Playbook以及执行自动化任务,旨在为读者提供一条清晰的路径,从而步入自动化运维的世界。
|
6天前
|
运维 网络安全 Python
自动化运维:使用Ansible实现批量服务器配置
在快速迭代的IT环境中,高效、可靠的服务器管理变得至关重要。本文将介绍如何使用Ansible这一强大的自动化工具,来简化和加速批量服务器配置过程。我们将从基础开始,逐步深入到更复杂的应用场景,确保即使是新手也能跟上节奏。文章将不包含代码示例,而是通过清晰的步骤和逻辑结构,引导读者理解自动化运维的核心概念及其在实际操作中的应用。
|
7天前
|
运维 Ubuntu 网络协议
自动化运维:使用Ansible进行服务器配置管理
在现代IT架构中,自动化运维已成为提升效率、减少人为错误的关键。本文将介绍如何使用Ansible这一强大的自动化工具来简化和标准化服务器的配置管理过程。通过具体的代码示例和操作步骤,我们将展示如何快速部署应用、管理配置以及自动化日常任务,从而确保环境的一致性和可靠性。
|
18天前
|
运维 安全 Ubuntu
自动化运维:使用Ansible进行服务器配置管理
在现代IT基础设施中,自动化运维是确保高效、稳定和安全服务的关键。本文将深入介绍如何使用Ansible这一开源工具来简化服务器配置管理工作,从基础安装到高级应用,我们将一步步展示如何通过Ansible Playbooks实现自动化部署和维护,旨在帮助读者构建更加灵活和可扩展的运维体系。
35 7
|
16天前
|
弹性计算 监控 容灾
阿里云ECS提供强大的云上灾备解决方案,通过高可用基础设施、多样的数据备份方式及异地灾备服务,帮助企业实现业务的持续稳定运行
在数字化时代,企业对信息技术的依赖加深,确保业务连续性至关重要。阿里云ECS提供强大的云上灾备解决方案,通过高可用基础设施、多样的数据备份方式及异地灾备服务,帮助企业实现业务的持续稳定运行。无论是小型企业还是大型企业,都能从中受益,确保在面对各种风险时保持业务稳定。
34 4
|
20天前
|
运维 监控 安全
盘点Linux服务器运维管理面板
随着云计算和大数据技术的迅猛发展,Linux服务器在运维管理中扮演着越来越重要的角色。传统的Linux服务器管理方式已经无法满足现代企业的需求,因此,高效、安全、易用的运维管理面板应运而生。
|
1月前
|
运维 应用服务中间件 调度
自动化运维:使用Ansible实现服务器批量管理
【10月更文挑战第26天】在当今快速发展的IT领域,自动化运维已成为提升效率、降低人为错误的关键技术手段。本文通过介绍如何使用Ansible这一强大的自动化工具,来简化和加速服务器的批量管理工作,旨在帮助读者理解自动化运维的核心概念和实践方法。文章将围绕Ansible的基础使用、配置管理、任务调度等方面展开,通过实际案例引导读者深入理解自动化运维的实现过程,最终达到提高运维效率和质量的目的。
|
2月前
|
运维 负载均衡 安全
自动化运维:使用Ansible进行服务器配置管理
【10月更文挑战第15天】在本文中,我们将探讨如何利用Ansible这一强大的自动化工具来简化和加速服务器的配置管理工作。通过实际案例和代码示例,我们将展示Ansible如何帮助运维人员高效地进行软件部署、系统更新和日常维护任务,从而提升工作效率并减少人为错误。