业务连续性解决方案架构(中)

本文涉及的产品
应用实时监控服务ARMS - 应用监控,每月50GB免费额度
简介: 在多平台、多应用的场景下,如何保障业务连续性成为运维人员以及公司的考虑重点,本文主要梳理影响业务连续性的各个方面以及所需的模块。(OM、VM、CM、APM)

架构中涉及的模块(补充中)


Operations Management


描述


运营管理中的宗旨是最短时候恢复事件故障,从而将故障的损失降到最低,在此前提下尽可能满足服务的要求。因此,事件管理突出的就是恢复企业的业务,启用备份,容灾系统等手段,第一时间采取各种措施来恢复企业生产,这就要求服务台将故障定义升级,从而确保工单的快速流转,通过各IT部门密切配合来排除故障。

服务台分发问题给IT部门,各部门对此问题进行评估,然后提交解决方案,方案通过后这一问题管理流程就可以关闭。

除此之外,还有配置管理、变更管理等流程,也属于管控企业IT系统的规范性问题。配置管理通过CMDB(配置管理数据库)的实时调整更新,可以对企业IT管理进行广度和深度的规划。变更管理主要强调对企业IT架构进行变更时,如何控制变更所带来的各种风险,通过变更计划、变更测试、变更执行、变更维护的步骤来实现企业IT架构的改进和更新。


功能


事件接入

事件和告警由特定的工具检测生成,并集成到统一的处理平台。平台解决操作系统运维过程中所需要的多种关键能力,通过 Web 化的界面管理方式,用户可以轻松运维。


事件处理

针对不同事件源产生的事件,诊断和调查事故,通过自定义数据提取,并将重复和冗余的噪音剔除,再通过规则或算法生成反映业务问题的事件集。


事件分派

根据事件集的特征,将通知在第一时间动态路由到个人、组、协作团队,并通过流程化管理确保事件信息和人员间无缝衔接。


事件响应

事件处理人员根据自身的条件,在PC端、移动端、协作工具中对事件进行认领、指派、协同、转发、关闭等操作。


事件解决

在问题解决后,将处理过程记录到事件解决方案中进行改进,沉淀知识以指导后续类似场景的处理。



Visual Management


描述


可视化管理主要是指数据大屏,围绕客户侧的业务指标以及稳定性指标和监控展示。运维大屏展示当前您需要重点关注的运维指标、任务整体运行情况、调度资源变化趋势等运维概览,以及离线同步、实时同步任务的运行状态分布、数据同步进度等数据集成信息,帮助您提升任务运维效率。


功能


业务运行状态

运行状态分布区域展示当前所有业务在指定时间段内正常运行状态的分布,统计OM所提交的页面实时数据,以及历史运行时长。


资源运营水位

展示指定时间段内各项资源组使用率和预警值。


风险事件标注

查看最新监控报警信息,包括自定义规则报警信息、全局规则报警信息、智能报警信息等,分优先级进行展示。配置监控规则报警方式时可以选择发送报警信息给值班表对应的值班人,支持邮件、短信、电话报警。


故障处理进度

可以查看昨日、今日和历史平均的处理成功或未处理的任务,并可以指定需要查看的故障等级。


变更风险管控

查看变更中的审批流程以及可能触及的风险的预判值,关联CM模块进行总体过程可视化输出。




Change Management


描述


变更管理是指项目组织为适应项目运行过程中与项目相关的各种因素的变化,保证项目目标的实现而对项目计划进行相应的部分变更或全部变更,并按变更后的要求组织项目实施的过程。


功能


变更申请

记录变更的详细信息,变更提出者简明扼要的记录下有价值的信息。变更管理工具不仅要能方便的记录信息,而且要给记录者一些记录的提示信息,帮助记录者准确的记录变更。


变更审核

审核者首先要确认变更意义,确认是否要修改;其次审核者要确认变更可能产生的影响,根据影响分析决定是否要修改下变更的内容以及对项目其它方面做同步改变;最后就是指派项目成员实施该变更。在这里,关键是审核者要能对变更的相关影响有清楚的认识,这认识并不是说如何修改变更,而是如果修改了该变更,有可能带来什么影响,是否值得修改。很显然,这些信息不是变更提出者在记录时会给出的,而应该是审核者自己辅助其它系统或者工具进行判断。


变更实施

根据变更要求进行修改。首先要保证修改实施是完全而彻底的,比如提了一个需求变更,不能只改了需求文档而不改代码或者用户文档。在组织分工情况下,如何协调多个小组的同步变更保证工作产品一致性正成为一个很严峻的问题。实现变更的一个初始目的就是为了项目的跟踪回溯,那么,针对变更而做的修改也应该被记录下来并被和变更关联起来,实现why、what的双向跟踪。


变更验证

确认验证变更确实得到了确实实施(或者拒绝变更的理由是合理的)。


查询和度量分析

项目管理者需要了解项目中各个变更的当前状态,根据变更状态做出各种管理决定;度量分析变更数据,了解项目质量状况;定期进行复盘,寻找变更根源,进行有针对性,甚至是制度化的改进。



Application Performance Management


描述


APM是应用性能管理/监控,监控能力是指基于云资源部署的具体应用场景,包括应用指标性能(Metric)、系统调用链(Tracing)、日志监控(Logging)三个维度,比如应用的 JVM 指标、线程池监控、RPC 服务的成功率、时延、错误率监控、以及应用全链路追踪能力。



功能


统一的视图

APM用来显示受控制台监控的网络性能、崩溃、启动加载、内存、图片、页面渲染、JVM监控,JMX监控,服务器监控,MySQL慢日志监控,Oracle监控,Redis监控,Nginx监控,docker监控,链路跟踪监控,并以图表的形式直观动态地进行展示。


无代理的监控模板

在被监控的服务器中启动监控客户端,配置相关的数据链接并点击启用,APM监控工具会自动获取监控数据并实时展示。


精准测量

使用 User Experience Monitor 测量 Quality of Experience (QoE),通过单个视图了解所有Web和非Web事务错误的根本原因。通过方法级别洞察获取错误的完整快照,并在终端用户受到影响之前采取必要的操作。


更新中......

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
目录
相关文章
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
【9月更文挑战第4天】赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
|
19天前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
50 9
|
1月前
|
存储 NoSQL Java
一天五道Java面试题----第十一天(分布式架构下,Session共享有什么方案--------->分布式事务解决方案)
这篇文章是关于Java面试中的分布式架构问题的笔记,包括分布式架构下的Session共享方案、RPC和RMI的理解、分布式ID生成方案、分布式锁解决方案以及分布式事务解决方案。
一天五道Java面试题----第十一天(分布式架构下,Session共享有什么方案--------->分布式事务解决方案)
|
30天前
|
Serverless
解决方案评测|《Serverless高可用架构》获奖名单
解决方案评测|《Serverless高可用架构》获奖名单正式公布!!
142 1
|
1月前
|
数据挖掘 关系型数据库 MySQL
Serverless高可用架构的解决方案体验
Serverless高可用架构的解决方案体验
144 6
|
1月前
|
机器学习/深度学习 分布式计算 Cloud Native
云原生架构下的高性能计算解决方案:利用分布式计算资源加速机器学习训练
【8月更文第19天】随着大数据和人工智能技术的发展,机器学习模型的训练数据量和复杂度都在迅速增长。传统的单机训练方式已经无法满足日益增长的计算需求。云原生架构为高性能计算提供了新的可能性,通过利用分布式计算资源,可以在短时间内完成大规模数据集的训练任务。本文将探讨如何在云原生环境下搭建高性能计算平台,并展示如何使用 PyTorch 和 TensorFlow 这样的流行框架进行分布式训练。
47 2
|
1月前
|
弹性计算 运维 关系型数据库
Serverless高可用架构解决方案评测
Serverless高可用架构方案提供卓越效能与极简运维体验,支持服务托管、弹性伸缩及按量付费,有效降低成本并优化性能。一键部署快速启动,流程直观,文档详实;但在高级配置与特定场景实践方面指导有限。方案采用双可用区部署确保高可用性,自动故障切换保障服务连续。成本模型按需计费,减轻企业负担。功能上集成监控、日志与负载均衡,简化运维,加速上线。性能方面,秒级弹性伸缩保证资源高效匹配负载。总体而言,此方案竞争力强,特别推荐给初创公司及需灵活应对流量波动的场景。
139 2
|
23天前
|
Kubernetes Cloud Native Docker
云原生之旅:从容器到微服务的架构演变
【8月更文挑战第29天】在数字化时代的浪潮下,云原生技术以其灵活性、可扩展性和弹性管理成为企业数字化转型的关键。本文将通过浅显易懂的语言和生动的比喻,带领读者了解云原生的基本概念,探索容器化技术的奥秘,并深入微服务架构的世界。我们将一起见证代码如何转化为现实中的服务,实现快速迭代和高效部署。无论你是初学者还是有经验的开发者,这篇文章都会为你打开一扇通往云原生世界的大门。
|
7天前
|
运维 Cloud Native Devops
云原生架构的崛起与实践云原生架构是一种通过容器化、微服务和DevOps等技术手段,帮助应用系统实现敏捷部署、弹性扩展和高效运维的技术理念。本文将探讨云原生的概念、核心技术以及其在企业中的应用实践,揭示云原生如何成为现代软件开发和运营的主流方式。##
云原生架构是现代IT领域的一场革命,它依托于容器化、微服务和DevOps等核心技术,旨在解决传统架构在应对复杂业务需求时的不足。通过采用云原生方法,企业可以实现敏捷部署、弹性扩展和高效运维,从而大幅提升开发效率和系统可靠性。本文详细阐述了云原生的核心概念、主要技术和实际应用案例,并探讨了企业在实施云原生过程中的挑战与解决方案。无论是正在转型的传统企业,还是寻求创新的互联网企业,云原生都提供了一条实现高效能、高灵活性和高可靠性的技术路径。 ##
18 3
|
12天前
|
监控 负载均衡 应用服务中间件
探索微服务架构下的API网关设计与实践
在数字化浪潮中,微服务架构以其灵活性和可扩展性成为企业IT架构的宠儿。本文将深入浅出地介绍微服务架构下API网关的关键作用,探讨其设计原则与实践要点,旨在帮助读者更好地理解和应用API网关,优化微服务间的通信效率和安全性,实现服务的高可用性和伸缩性。
31 3

热门文章

最新文章