管理系统中风险是系统可用性和可扩展性的关键(3)

简介: 管理系统中风险是系统可用性和可扩展性的关键(3)


对单项失效模式和效果打分后,将这些分数相乘得到总的风险评分,即可能性得分×严重性得分×检测能力得分。这个分数显示了一个特定组件在整体行为中的整体风险。


FMEA过程的下一步是确定可以执行或落实到位的缓解步骤,以降低特定因素的风险。例如,如果一个功能组件的可检测能力有非常高的风险分数,这意味着如果事件发生,那将很难发出通知。因此该团队可能会决定提前准备一些查询,在产品或服务发布后,每小时检查一次数据库,检测是否有故障发生的迹象,如丢失数据或数据错误。此缓解措施对该组件的风险因素有降低的作用,同时应该说明风险可以降低到什么程度。


在表中,有两个人力资源管理系统(HRM)的应用实例:公司客户的新注册流程和改用新的信用卡处理器。这些功能有几种故障模式。让我们来看看信用卡的支付功能,重点放在信用卡账单错误的故障模式,它的影响是支付时被收取过多或者过少的费用。在我们的例子中,工程师可能会将这个故障的风险设成1分,或者是不太可能发生。也许这个功能经过了深入全面的代码审查和质量保证测试,因为它处理的是信用卡,所以风险度较低。工程师觉得这种故障会带来灾难性的影响,所以故障的严重性自评为9分。这似乎是合理的,因为错误的信用卡账单会引发客户的愤怒、昂贵的退款、潜在的退回许可证费用。工程师认为故障检测难度将是中等,因此故障可检测能力自评为3分。此故障模式的总风险评分为1×9×3=27。已经确定了该功能集的补救行动,在beta测试中推出的新支付处理应用仅限于某些客户使用。因为客户的影响将是有限的,这样将减少故障的严重性。采取这种补救措施后,因为故障严重性降低,风险将降低到3分,修订后的风险评分仅为9分,大大好于以前。


image.png


image.png


FMEA风险评估过程很有条理性,这使风险评估能够长期得以记录、培训、评估和改善。另一个优点是精度。特别是随着时间的推移,团队在识别故障和准确地评估风险方面可以做得更好,这种方法是最准确的风险确定方式。FMEA方法的缺点是它需要时间和思考。投入到分析中的时间和精力越多,结果就会越好、越准确。这种方法与测试驱动开发非常相似,而且互补。在研发前进行FMEA会提高设计和错误的处理水平。


我们将在下一节讨论,风险测量的分数,特别是那些利用FMEA方法得到的,可以在系统任意时间间隔或任一应用版本发布中管理风险的数量。风险评估的下一步是要有人或团队可以对评估的精度进行评价,对决策提出质疑。这也是采用如FMEA这样系统化方法的好处:人人都可以通过培训学会使用,因此可以互查以确保用最高的质量标准进行评估。评估过程的最后一步是在行动后重新评估,看你和专家们在确定合适的故障模式和评估因素时的准确率。如果不可能发现的问题出现了,请专家调查详细的情况并提供潜在的情况不能被提前发现的原因,警告其他专家注意这种类型的故障。


风险评估步骤



如果你正在计划使用任何有条理的方法来进行风险评估,下面是适当的风险评估步骤。这些步骤适用于交通灯方法或FMEA方法:


1. 确定合适的粒度级别来评估风险。

2. 选择一个可以复制的方法。

3. 对将进行风险评估的人进行培训。

4. 安排事后评审每一个评估,或者集体回顾所有的评估。

5. 选择一个合适的评分表(例如,1、3、9),并考虑好需要如何保守。

6. 完成代码发布或系统维护后,对故障类型、可能性、严重性及可检测性进行审查。


无论使用的是交通灯方法、FMEA或其他风险评估方法,一定要遵循这些步骤,确保可用于全面风险管理的风险评估的成功。

 





相关文章
|
数据安全/隐私保护 Docker 容器
error: Could not get shadow information for NOUSER 问题如何处理
【6月更文挑战第15天】error: Could not get shadow information for NOUSER 问题如何处理
1830 3
|
SQL 关系型数据库 MySQL
C#使用Npgsql或SqlClient连接数据库
在C#使用Npgsql和SqlClient连接SQLserver、pgsql
975 2
|
弹性计算 人工智能 运维
OS Copilot 产品体验测评
```markdown # OS Copilot 体验摘要 - 运维人员发现OS Copilot在自动化、故障排查等场景有用,给予8-9分帮助评分。 - 特别喜欢知识问答和辅助编程功能,提升效率。 - 相比其他产品,OS Copilot在特定环境优化强,但不那么灵活,部分代码质量有待提高,且非免费。 - 希望扩展支持更多OS,增强错误分析和安全性,并简化安装。 - 愿意推荐并参与开源开发,如与ACK、ECS、Workbench联动,提升智能运维和开发效率。 ```
172 0
|
存储 机器学习/深度学习 大数据
云计算与大数据:合作与创新
本文探讨了大数据技术与云计算的背景和发展,大数据的5V特征(量、速度、多样、复杂、不确定)及云计算的3S特点(服务、共享、可扩展)。两者相互依赖,云计算为大数据提供计算与存储资源。核心算法涉及分布式计算、数据挖掘和机器学习,如线性回归、逻辑回归等。通过代码示例展示了Hadoop的MapReduce、Scikit-learn的KNN和TensorFlow的线性回归应用。未来趋势包括数据量增长、实时处理、AI与ML集成及数据安全挑战。附录解答了大数据、云计算等相关问题。
900 3
|
Shell Linux C语言
【Linux进程】六、wait()函数——子进程回收
【Linux进程】六、wait()函数——子进程回收
749 0
【Linux进程】六、wait()函数——子进程回收
聊聊MySQL架构演进:从主从复制到分库分表
背景 业务飞速发展导致数据规模急速膨胀,单机的数据库已经无法满足互联网业务的发展。 传统的将数据集中存储单一数据结节的方案,在容量、性能、可用性和可维护性方面已经难以满足互联网海量数据的场景。
|
缓存 前端开发 JavaScript
浏览器工作原理是什么?底层原理是什么?
浏览器工作原理是什么?底层原理是什么?
491 0
|
19天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
32198 117
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
9天前
|
应用服务中间件 API 网络安全
3分钟汉化OpenClaw,使用Docker快速部署启动OpenClaw(Clawdbot)教程
2026年全新推出的OpenClaw汉化版,是基于Claude API开发的智能对话系统本土化优化版本,解决了原版英文界面的使用壁垒,实现了界面、文档、指令的全中文适配。该版本采用Docker容器化部署方案,开箱即用,支持Linux、macOS、Windows全平台运行,适配个人、企业、生产等多种使用场景,同时具备灵活的配置选项和强大的扩展能力。本文将从项目简介、部署前准备、快速部署、详细配置、问题排查、监控维护等方面,提供完整的部署与使用指南,文中包含实操代码命令,确保不同技术水平的用户都能快速落地使用。
4721 4
|
15天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
6821 18
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手