业务连续性解决方案架构(上)

简介: 在多平台、多应用的场景下,如何保障业务连续性成为运维人员以及公司的考虑重点,本文主要梳理影响业务连续性的各个方面以及所需的模块。(CMDB、Monitor、KM、TM)

架构中涉及的模块(补充中)


CMDB


描述


配置管理数据库( Configuration Management Database,CMDB)是一个逻辑数据库,以应用和业务驱动的,需要什么数据,就创造什么数据,通过灵活数据建模,来实现以需求为导向的 CMDB 建设。包含了配置项全生命周期的信息以及配置项之间的关系(包括物理关系、实时通信关系、非实时通信关系和依赖关系)。

通过完善的 Web API 来进行各个流程或应用之间的数据通信,例如:数据上报,验证,获取,更新等等。从而高效控制与管理不断变化的IT基础架构与IT服务,并为其它流程提供准确的配置信息。

简而言之就是可自定义模型可编排的底层数据库,适配客户现场的情况,每个客户的生产环境都不一样,关注点也不一样,可以通过这个根据客户事件情况建模。


功能


资源标准化管理

      通过自动和手动方式,将各处分散的资源信息进行标准化处理和整合,维护资源信息及资源间的关联关系,并记录资源信息的变化过程。与服务管理结合,实现资源的流程化、标准化管理。


IT监控与故障分析

维护从底层基础架构到上层业务应用的关联关系,在设备发生故障时,快速分析出对业务造成的影响,从而辅助判断应对措施。也可用于在资源变更前快速判断变更所影响的范围,从而做出相应决策。


自动化运维

与自动化运维工具深度集成,为自动化运维工具提供准确的设备、组件信息,支持自动化部署、故障自愈、DevOps等自动化运维场景。


IT服务管理

基于ITIL理念,与IT服务管理产品结合,将配置项与所有服务支持和服务交付流程深度关联,支撑设备故障、变更、发布等流程的运转。在流程流转中,快速找到当前设备故障、变更引发的关联配置内容,同时依赖于相关流程保证数据的正确性。


安全管理与审计

对资源的变更过程进行跟踪,对操作人员、操作时间、操作类型等审计信息进行准确记录,使所有变更都可追溯、可恢复,满足合规性要求,便于进行安全分析,保障数据安全。



Monitor


描述


轻量化的监控系统,资源占用少,性能高。对iaas、paas、saas层面统一管控。

数据采集免配置: agent自发现、agent主动推送, 任何数据自定义脚本。

支持对单个主机停止报警,多时间段内支持报警升级,最多5个级别的升级。

对接云底座运维工具,ASO/CMS/BCC/TianjiMon等,还有应用及业务监控的对接,Prometheus/EMAS/SLS以及客户侧各种开源工具等。


功能


主要用途是进行监控过滤收敛,自定义监控。


业务监控

通过Agent采集具体的核心业务模块。


应用监控

通过exporte对接服务端的应用,比如JVM、DB、MQ、NGINX等。


基础监控

通过Agent、接口对接生产环境的基础性能指标,比如CPU、Load、MEN、Network、Disk等。


IOT监控

通过Agent、MQTT对接IOT设备,比如摄像头、智能开关、AP、POS等。


集成监控

通过接口对接各种第三方监控,比如云底层监控,第三方软件监控等。



Knowledge Management


描述


知识管理是快速建立其他系统的基本能力,可以说是抓手系统,可以将知识管理系统分成六个子系统,分别是信息搜索系统,信息筛选系统,知识输入系统,加工整理系统,知识输出系统,存储调用系统。可以实现MTTR缩短。

知识管理流程:获取>创造>分类>存储>分享>更新>价值


功能


知识沉淀

利用软件系统或其他工具,对组织中大量的有价值的方案、策划、成果、经验等知识进行分类存储和管理,积累知识资产避免流失。


协同共享

增强员工之间的知识流动,进行多人协同、项目协同、文档共享。


知识应用

提高变更管理问题中的决策效果,提高应对故障的能力,提高员工及业务效率,提供应急预案,快速恢复。


知识赋能

促进知识的学习和培训,以及再利用和创新,比如爬虫系统、大数据应用、智能算法推荐。



Ticket Management


描述


工单系统Ticket system又称为工单管理系统,根据不同的需求,来有针对的管理、维护和追踪一系列的问题和请求。

工单管理系统是为了支撑其它系统而存在的,所以在设计结构时既要考虑工单本身,又需要考虑其他系统。


功能


用来创建、挂起、解决用户提交的事务请求。规范化、统一化和清晰化的处理和管理事务。一个完整的工单系统还需要配套拥有一个帮助文档知识库(Knowledge base),里面包含客户的一些常见受理问题相关信息,常见问题的处理方式,和一些其他的帮助文档等。一个工单系统就像一个问题追踪器,能很清晰的追踪,处理和归档内外的问题事务请求,标准化服务追踪用户,具有批量性、时效性、绩效性的特点。


工单内容

工单页面中主要记录工单信息,和工单关联信息,比如一个工单就需要有发起人、类型、内容、状态等信息,同时提供处理工单相关联的信息。


工单状态

工单在创建好以后,是需要流转的,是需要用状态来标识的。


工单日志

工单从创建到结束有一个过程,工单日志主要记录这个过程以及这个过程中不同人员对工单的操作。比如系统日志、操作记录等。


工单分配

工单创建好以后,会有不同的人员对工单进行处理,需要支持系统分配和人工分配以及SLA升级事件。


工单类型

工单内容记录的是不同业务场景下的问题,在工单系统中以工单类型来区分,比如严重、高危、中危、低危,不同的工单类型有不同的使用场景,会产生不同的处理结果。


处理人员

工单处理人员基于类型进行设置,即不同的工单类型第一处理人不同,通过处理人员设置,系统就可以将工单自动进行分配,同时也可以基于处理人员的设置来进行工单权限的判断,有A类工单处理权限的人员可以在系统中看到A类工单,可以等待系统分配,也可以自动去接工单处理。以及进行日程灵活排班。


处理结果

对处理结果进行记录,记录好以后,触发其他系统的单据或者操作,比如服务效能评价,满意度调查,进而人员考核。


分析报表

通过对工单问题的分析,可以反推业务的优化,通过对工单处理时长的分析,可以对工单SOP进行优化。



更新中......

目录
相关文章
|
17天前
|
SQL 弹性计算 运维
云卓越架构:稳定性支柱整体解决方案综述
阿里云卓越架构聚焦于五大支柱,其中稳定性是关键。常见的云上稳定性风险包括架构单点、容灾设计不足和容量规划不合理等。为提升稳定性,需从架构设计时考虑容灾与容错、实施变更时遵循“三板斧”原则(灰度发布、可观测性和可回滚性),并确保快速响应和恢复能力。此外,通过客观度量、主观评估和巡检等方式识别风险,并进行专项治理。识货APP作为成功案例,通过优化容器化改造、统一发布体系、告警系统和扩缩容机制,实现了99.8%的高可用率,大幅提升了业务稳定性。
|
1月前
|
Serverless 决策智能 UED
构建全天候自动化智能导购助手:从部署者的视角审视Multi-Agent架构解决方案
在构建基于多代理系统(Multi-Agent System, MAS)的智能导购助手过程中,作为部署者,我体验到了从初步接触到深入理解再到实际应用的一系列步骤。整个部署过程得到了充分的引导和支持,文档详尽全面,使得部署顺利完成,未遇到明显的报错或异常情况。尽管初次尝试时对某些复杂配置环节需反复确认,但整体流程顺畅。
|
2月前
|
消息中间件 监控 Cloud Native
云原生架构下的数据一致性挑战与解决方案####
在数字化转型加速的今天,云原生架构以其轻量级、弹性伸缩和高可用性成为企业IT架构的首选。然而,在享受其带来的灵活性的同时,数据一致性问题成为了不可忽视的挑战。本文探讨了云原生环境中数据一致性的复杂性,分析了导致数据不一致的根本原因,并提出了几种有效的解决策略,旨在为开发者和企业提供实践指南,确保在动态变化的云环境中保持数据的完整性和准确性。 ####
|
2月前
|
传感器 算法 物联网
智能停车解决方案之停车场室内导航系统(二):核心技术与系统架构构建
随着城市化进程的加速,停车难问题日益凸显。本文深入剖析智能停车系统的关键技术,包括停车场电子地图编辑绘制、物联网与传感器技术、大数据与云计算的应用、定位技术及车辆导航路径规划,为读者提供全面的技术解决方案。系统架构分为应用层、业务层、数据层和运行环境,涵盖停车场室内导航、车位占用检测、动态更新、精准导航和路径规划等方面。
167 4
|
2月前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
112 1
|
3月前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
81 3
|
4月前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
208 9
|
1月前
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
2月前
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
64 3
|
2月前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####

热门文章

最新文章