业务连续性解决方案架构(上)

简介: 在多平台、多应用的场景下,如何保障业务连续性成为运维人员以及公司的考虑重点,本文主要梳理影响业务连续性的各个方面以及所需的模块。(CMDB、Monitor、KM、TM)

架构中涉及的模块(补充中)


CMDB


描述


配置管理数据库( Configuration Management Database,CMDB)是一个逻辑数据库,以应用和业务驱动的,需要什么数据,就创造什么数据,通过灵活数据建模,来实现以需求为导向的 CMDB 建设。包含了配置项全生命周期的信息以及配置项之间的关系(包括物理关系、实时通信关系、非实时通信关系和依赖关系)。

通过完善的 Web API 来进行各个流程或应用之间的数据通信,例如:数据上报,验证,获取,更新等等。从而高效控制与管理不断变化的IT基础架构与IT服务,并为其它流程提供准确的配置信息。

简而言之就是可自定义模型可编排的底层数据库,适配客户现场的情况,每个客户的生产环境都不一样,关注点也不一样,可以通过这个根据客户事件情况建模。


功能


资源标准化管理

      通过自动和手动方式,将各处分散的资源信息进行标准化处理和整合,维护资源信息及资源间的关联关系,并记录资源信息的变化过程。与服务管理结合,实现资源的流程化、标准化管理。


IT监控与故障分析

维护从底层基础架构到上层业务应用的关联关系,在设备发生故障时,快速分析出对业务造成的影响,从而辅助判断应对措施。也可用于在资源变更前快速判断变更所影响的范围,从而做出相应决策。


自动化运维

与自动化运维工具深度集成,为自动化运维工具提供准确的设备、组件信息,支持自动化部署、故障自愈、DevOps等自动化运维场景。


IT服务管理

基于ITIL理念,与IT服务管理产品结合,将配置项与所有服务支持和服务交付流程深度关联,支撑设备故障、变更、发布等流程的运转。在流程流转中,快速找到当前设备故障、变更引发的关联配置内容,同时依赖于相关流程保证数据的正确性。


安全管理与审计

对资源的变更过程进行跟踪,对操作人员、操作时间、操作类型等审计信息进行准确记录,使所有变更都可追溯、可恢复,满足合规性要求,便于进行安全分析,保障数据安全。



Monitor


描述


轻量化的监控系统,资源占用少,性能高。对iaas、paas、saas层面统一管控。

数据采集免配置: agent自发现、agent主动推送, 任何数据自定义脚本。

支持对单个主机停止报警,多时间段内支持报警升级,最多5个级别的升级。

对接云底座运维工具,ASO/CMS/BCC/TianjiMon等,还有应用及业务监控的对接,Prometheus/EMAS/SLS以及客户侧各种开源工具等。


功能


主要用途是进行监控过滤收敛,自定义监控。


业务监控

通过Agent采集具体的核心业务模块。


应用监控

通过exporte对接服务端的应用,比如JVM、DB、MQ、NGINX等。


基础监控

通过Agent、接口对接生产环境的基础性能指标,比如CPU、Load、MEN、Network、Disk等。


IOT监控

通过Agent、MQTT对接IOT设备,比如摄像头、智能开关、AP、POS等。


集成监控

通过接口对接各种第三方监控,比如云底层监控,第三方软件监控等。



Knowledge Management


描述


知识管理是快速建立其他系统的基本能力,可以说是抓手系统,可以将知识管理系统分成六个子系统,分别是信息搜索系统,信息筛选系统,知识输入系统,加工整理系统,知识输出系统,存储调用系统。可以实现MTTR缩短。

知识管理流程:获取>创造>分类>存储>分享>更新>价值


功能


知识沉淀

利用软件系统或其他工具,对组织中大量的有价值的方案、策划、成果、经验等知识进行分类存储和管理,积累知识资产避免流失。


协同共享

增强员工之间的知识流动,进行多人协同、项目协同、文档共享。


知识应用

提高变更管理问题中的决策效果,提高应对故障的能力,提高员工及业务效率,提供应急预案,快速恢复。


知识赋能

促进知识的学习和培训,以及再利用和创新,比如爬虫系统、大数据应用、智能算法推荐。



Ticket Management


描述


工单系统Ticket system又称为工单管理系统,根据不同的需求,来有针对的管理、维护和追踪一系列的问题和请求。

工单管理系统是为了支撑其它系统而存在的,所以在设计结构时既要考虑工单本身,又需要考虑其他系统。


功能


用来创建、挂起、解决用户提交的事务请求。规范化、统一化和清晰化的处理和管理事务。一个完整的工单系统还需要配套拥有一个帮助文档知识库(Knowledge base),里面包含客户的一些常见受理问题相关信息,常见问题的处理方式,和一些其他的帮助文档等。一个工单系统就像一个问题追踪器,能很清晰的追踪,处理和归档内外的问题事务请求,标准化服务追踪用户,具有批量性、时效性、绩效性的特点。


工单内容

工单页面中主要记录工单信息,和工单关联信息,比如一个工单就需要有发起人、类型、内容、状态等信息,同时提供处理工单相关联的信息。


工单状态

工单在创建好以后,是需要流转的,是需要用状态来标识的。


工单日志

工单从创建到结束有一个过程,工单日志主要记录这个过程以及这个过程中不同人员对工单的操作。比如系统日志、操作记录等。


工单分配

工单创建好以后,会有不同的人员对工单进行处理,需要支持系统分配和人工分配以及SLA升级事件。


工单类型

工单内容记录的是不同业务场景下的问题,在工单系统中以工单类型来区分,比如严重、高危、中危、低危,不同的工单类型有不同的使用场景,会产生不同的处理结果。


处理人员

工单处理人员基于类型进行设置,即不同的工单类型第一处理人不同,通过处理人员设置,系统就可以将工单自动进行分配,同时也可以基于处理人员的设置来进行工单权限的判断,有A类工单处理权限的人员可以在系统中看到A类工单,可以等待系统分配,也可以自动去接工单处理。以及进行日程灵活排班。


处理结果

对处理结果进行记录,记录好以后,触发其他系统的单据或者操作,比如服务效能评价,满意度调查,进而人员考核。


分析报表

通过对工单问题的分析,可以反推业务的优化,通过对工单处理时长的分析,可以对工单SOP进行优化。



更新中......

目录
相关文章
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
【9月更文挑战第4天】赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
|
19天前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
50 9
|
1月前
|
存储 NoSQL Java
一天五道Java面试题----第十一天(分布式架构下,Session共享有什么方案--------->分布式事务解决方案)
这篇文章是关于Java面试中的分布式架构问题的笔记,包括分布式架构下的Session共享方案、RPC和RMI的理解、分布式ID生成方案、分布式锁解决方案以及分布式事务解决方案。
一天五道Java面试题----第十一天(分布式架构下,Session共享有什么方案--------->分布式事务解决方案)
|
30天前
|
Serverless
解决方案评测|《Serverless高可用架构》获奖名单
解决方案评测|《Serverless高可用架构》获奖名单正式公布!!
142 1
|
1月前
|
数据挖掘 关系型数据库 MySQL
Serverless高可用架构的解决方案体验
Serverless高可用架构的解决方案体验
144 6
|
1月前
|
机器学习/深度学习 分布式计算 Cloud Native
云原生架构下的高性能计算解决方案:利用分布式计算资源加速机器学习训练
【8月更文第19天】随着大数据和人工智能技术的发展,机器学习模型的训练数据量和复杂度都在迅速增长。传统的单机训练方式已经无法满足日益增长的计算需求。云原生架构为高性能计算提供了新的可能性,通过利用分布式计算资源,可以在短时间内完成大规模数据集的训练任务。本文将探讨如何在云原生环境下搭建高性能计算平台,并展示如何使用 PyTorch 和 TensorFlow 这样的流行框架进行分布式训练。
47 2
|
1月前
|
弹性计算 运维 关系型数据库
Serverless高可用架构解决方案评测
Serverless高可用架构方案提供卓越效能与极简运维体验,支持服务托管、弹性伸缩及按量付费,有效降低成本并优化性能。一键部署快速启动,流程直观,文档详实;但在高级配置与特定场景实践方面指导有限。方案采用双可用区部署确保高可用性,自动故障切换保障服务连续。成本模型按需计费,减轻企业负担。功能上集成监控、日志与负载均衡,简化运维,加速上线。性能方面,秒级弹性伸缩保证资源高效匹配负载。总体而言,此方案竞争力强,特别推荐给初创公司及需灵活应对流量波动的场景。
139 2
|
23天前
|
Kubernetes Cloud Native Docker
云原生之旅:从容器到微服务的架构演变
【8月更文挑战第29天】在数字化时代的浪潮下,云原生技术以其灵活性、可扩展性和弹性管理成为企业数字化转型的关键。本文将通过浅显易懂的语言和生动的比喻,带领读者了解云原生的基本概念,探索容器化技术的奥秘,并深入微服务架构的世界。我们将一起见证代码如何转化为现实中的服务,实现快速迭代和高效部署。无论你是初学者还是有经验的开发者,这篇文章都会为你打开一扇通往云原生世界的大门。
|
7天前
|
运维 Cloud Native Devops
云原生架构的崛起与实践云原生架构是一种通过容器化、微服务和DevOps等技术手段,帮助应用系统实现敏捷部署、弹性扩展和高效运维的技术理念。本文将探讨云原生的概念、核心技术以及其在企业中的应用实践,揭示云原生如何成为现代软件开发和运营的主流方式。##
云原生架构是现代IT领域的一场革命,它依托于容器化、微服务和DevOps等核心技术,旨在解决传统架构在应对复杂业务需求时的不足。通过采用云原生方法,企业可以实现敏捷部署、弹性扩展和高效运维,从而大幅提升开发效率和系统可靠性。本文详细阐述了云原生的核心概念、主要技术和实际应用案例,并探讨了企业在实施云原生过程中的挑战与解决方案。无论是正在转型的传统企业,还是寻求创新的互联网企业,云原生都提供了一条实现高效能、高灵活性和高可靠性的技术路径。 ##
18 3
|
12天前
|
监控 负载均衡 应用服务中间件
探索微服务架构下的API网关设计与实践
在数字化浪潮中,微服务架构以其灵活性和可扩展性成为企业IT架构的宠儿。本文将深入浅出地介绍微服务架构下API网关的关键作用,探讨其设计原则与实践要点,旨在帮助读者更好地理解和应用API网关,优化微服务间的通信效率和安全性,实现服务的高可用性和伸缩性。
31 3

热门文章

最新文章