从三个维度概述当前IT运维现状

简介: 【6月更文挑战第5天】从技术、服务和组织三个维度讨论IT运维现状。

1、运维技术维度

1)已经完全成熟的晚期大众技术:主要以ITIL、ITOM工具、ITOA工具和应用运维工具为主。这些传统技术如各类监控工具、ITSM流程工具、应用维护产品、虚拟化运维工具、其他传统厂商的运维和展示工具等都已被应用多年,支撑传统的物理机、虚拟化环境已经绰绰有余,主要用于支撑传统非云环境的集中式架构应用。


2)尚未完全成熟的早期大众技术:包括3类:资源运维类工具、Dev0ps类工具、自动化运维类工具。资源运维类工具包括基础设施运维工具、Kubernetes、Docker等,主要用于解决新型的面向Dev0ps的基础资源统一运维服务的问题;Dev0ps类工具包括CI/CD工具、Dev0ps工具,主要用于解决敏捷交付中开发流水线以及开发与运维协同相关的问题;自动化运维类工县用干解决云平台与分布式环境下,海量应用服务监控以及海量基础资源的批量操作问题。


3)处于探索阶段的早期技术:包括应用的架构及管理模式、运维的组织模式以及运维的技术手段3种类型。应用的架构主要以Service Mesh(服务网格)为代表。总体而言,处于非成熟性技术都未经过大规模落地和实践的检验,需审慎选择。


综上,整体上国内的运维技术包含研发、运维、运营全生命周期,与国外比较类似:ITIL和传统厂商的ITOM工具日渐成熟,各类新型的资源管理和自动化技术莲勃发展,而以AI0ps为代表的前沿技术被越来越广泛地探索和实验。


2、运维服务维度

对互联网公司而言,运维效率优先,同时兼顾管控,近年来逐步借鉴ITIL理念,通过自研的方式构建了符合自身情况的IT流程管理。此类IT流程管理工具往往能够与CMDB、自动化工具、监控工具等进行较好地融合,实现流程管理的自动化。


大型传统企业,如国内四大银行中的某大型银行,ITIL理念依然以ITIL v3为主,更加注重运维过程审批、管控、记录、合规及审计,对运维效能的关注和实践不足。在企业自动化运维水平逐步提升之后,大型企业已经意识到纯管控式运维服务对整体运维转型和效能提升的梏,已经在逐步解决此问题。


其他传统企业在运维服务维度的建设情况各有不同。部分中大型企业仅关注如事件、故障、变更等重点流程,且也以管控为主;大部分中型企业使用简单的运维工单;一些小规模企业可能在企业办公系统0A上运行相关流程。


总之,传统行业的头部企业的运维服务建设以流程式管控为主,很少能兼顾运维效能和运维敏捷性;而更多的中大型企业、中型企业尚未建立标准化的运维服务模式,敏捷式管理更无从谈起。头部互联网公司在运维服务维度也仅走到了流程自动化阶段,距离融合式、敏捷化流程管理还相当远。


3、运维组织维度

1)运维支撑平台团队:负责运维中台的建设和通用运维能力的输出,例如资源管控能力、作业编排能力等;负责平台能力的迭代与升级,以不断满足各个运维小组对运维底座能力的要求。


2)应用运维团队:负责业务和应用系统的全生命周期的运维支撑与管理;基于运维平台,开发通用的或者个性化的运维场景工具,支撑自身应用的运维。


3)基础设施资源管理团队:负责包括物理机、云主机等各类资源的调度与供给。


4)安全管理团队:主要负责运维过程中的事前安全标准制定、事中安全审核以及事后安全审计。


5)运维指导组:主要负责整体运维规范、标准、组织、岗位、人员能力等的规划与考核。


对于传统大型企业而言,例如大型银行单位,其运维组织往往是金字塔形的职能式架构。这种架构的优点是结构简单、构建自然、管理方便,同时每个团队在专业职能上可以深度发展。缺点也很明显:当业务系统的运维支撑越来越强调端到端的自动化和敏捷时,职能模式形成的部门墙会成为很大的阻碍。


其他非互联网行业的中大型企业基本采用类似的职能式架构,只不过根据运维人员数量进行了相应精简和调整。


数字化时代,企业的所有业务模式和运营过程都离不开IT系统的支撑,而IT系统的背后则是运维管理体系的数字化管理和敏捷管理。数字化转型不仅影响企业的业务战略和业务运营,还直接影响企业的研发运维服务模式。数字化转型的要义在于端到端的、全方位的、立体的“连接+数据+智能”,一方面需要企业更新和新建更多业务系统,实现基本的数字化支撑,另一方面需要企业更加敏捷地识别、捕获和响应市场端的需求,推陈出新,更好地服务客户。这两方面都需要数字化和敏捷的研发运维服务模式的支撑,否则企业的业务敏捷和模式创新就会成为空中楼阁。



相关文章
|
2月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
69 2
|
1天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在企业IT管理中的应用与实践####
本文深入探讨了智能化运维(AIOps)的核心技术原理,通过对比传统运维模式,揭示了AIOps如何利用大数据、机器学习等先进技术提升故障预测准确性、优化资源分配及自动化处理流程。同时,文章详细阐述了智能化运维平台的实施步骤,包括数据收集与分析、模型训练与部署、以及持续监控与优化,旨在为企业IT部门提供一套切实可行的智能化转型路径。最后,通过几个典型应用案例,如某大型电商平台的智能告警系统和金融企业的自动化故障排查流程,直观展示了智能化运维在实际业务场景中的显著成效,强调了其在提升运维效率、降低运营成本方面的关键作用。 ####
22 4
|
13天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用与挑战###
本文探讨了人工智能(AI)技术在IT运维领域的应用现状、具体实现方式及其面临的挑战。通过分析AI如何优化故障预测、自动化处理和资源管理,文章旨在揭示AI赋能下运维工作的变革潜力与实践难题,为读者提供对智能化运维趋势的深刻理解。 ###
|
20天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代IT基础设施中的应用与价值####
本文探讨了智能化运维(AIOps)在现代IT基础设施管理中的实际应用、面临的挑战及其带来的深远影响。通过引入先进的算法和机器学习模型,智能化运维不仅提高了故障检测与响应的速度,还显著优化了资源配置,降低了运营成本,为企业数字化转型提供了强有力的技术支撑。 ####
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI驱动下的IT运维革命###
本文探讨了人工智能(AI)技术在IT运维领域的创新应用,强调其在提升效率、预防故障及优化资源配置中的关键作用,揭示了智能运维的新趋势。 ###
|
28天前
|
机器学习/深度学习 人工智能 运维
智能化运维:提升IT服务效率的新引擎###
本文深入浅出地探讨了智能化运维(AIOps)如何革新传统IT运维模式,通过大数据、机器学习与自动化技术,实现故障预警、快速定位与处理,从而显著提升IT服务的稳定性和效率。不同于传统运维依赖人工响应,AIOps强调预测性维护与自动化流程,为企业数字化转型提供强有力的支撑。 ###
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用探索###
随着信息技术的飞速发展,传统的IT运维模式正面临着前所未有的挑战。本文旨在探讨人工智能(AI)技术如何赋能IT运维,通过智能化手段提升运维效率、降低故障率,并为企业带来更加稳定高效的服务体验。我们将从AI运维的概念入手,深入分析其在故障预测、异常检测、自动化处理等方面的应用实践,以及面临的挑战与未来发展趋势。 ###
|
21天前
|
机器学习/深度学习 运维 监控
智能运维在现代IT架构中的转型之路####
【10月更文挑战第29天】 本文旨在探讨智能运维(AIOps)如何成为现代IT架构不可或缺的一部分,通过分析其核心价值、关键技术及实践案例,揭示AIOps在提升系统稳定性、优化资源配置及加速故障响应中的关键作用。不同于传统运维模式的被动响应,智能运维强调预测性维护与自动化处理,为企业数字化转型提供强有力的技术支撑。 ####
66 0
|
1月前
|
人工智能 运维 监控
运维技术深度解析:构建高效、稳定的IT基础设施
【10月更文挑战第22天】运维技术深度解析:构建高效、稳定的IT基础设施
62 0
|
1月前
|
机器学习/深度学习 边缘计算 运维
运维技术深度解析:构建高效、稳定的IT基础设施
【10月更文挑战第22天】运维技术深度解析:构建高效、稳定的IT基础设施
52 0