ebay增强可用性的4个原则(3)

简介: ebay增强可用性的4个原则(3)

泳道与虚拟化

当使用虚拟化技术将较大的服务器分割成较小服务器时,尝试沿物理服务器边界保持泳道。在同个物理服务器上混合不同泳道的虚拟服务器抵消了故障隔离泳道的许多好处。



微信图片_20220123183208.jpg


规则2——拒绝单点故障

内容:永远不要实施会带有单点故障的设计,一直要消除单点故障。

场景:在架构审查和新系统设计时。

用法:在架构图上寻找单个实例。尽最大可能配制成主动/主动模式。

原因:通过多实例配置最大化可用性。

要点:努力实施主动/主动而非主动/被动配置。使用负载均衡器在服务的不同实例之间实现流量平衡。对需要单例的情形,可以在主动/被动模式的实例中采用控制服务。

 

在数学中,单元素集合是只有一个元素{A}的集合。按照编程的说法,单例模式是模拟数学概念的设计模式,把类的实例化限制在只有一个对象。这种设计模式对于资源协调很有用,但经常被研发人员出于便捷的目的而过度使用。在系统架构中,单例模式(或更恰当地说,反模式的单件情况)称为单点故障(SPOF)。这是指系统中仅有一个实例,当它失败时将导致系统范围的事故。


SPOF可以存在于系统的任何地方,包括单个网络服务器或单个网络设备,但最常见的是数据库系统中。原因是数据库往往最难跨越多个节点扩展,因此成为单例。在图9-1中,即使有冗余的登录、搜索和结账服务器,数据库也是SPOF。更糟糕的是,所有的服务池都依赖于那个单个数据库。虽然SPOF不好,但是数据库作为SPOF问题更大,因为如果数据库减慢或崩溃,所有同步调用该数据库的服务池都会遇到问题。


我们有个与客户分享的口头禅:“一切皆可能出故障。”这包括服务器、存储系统、网络设备和数据中心。凡能说出来的,都可能出故障,而且可能我们已经看到了这些故障。虽然大多数人认为数据中心永远不会出故障,但这些年我们亲身经历了十多次数据中心的服务中断。这同样适用于高可用的存储区域网络。尽管它明显比旧的SCSI磁盘阵列更可靠,但它仍然会出故障。


微信图片_20220123183222.jpg


大多数SPOF的解决方案是直接部署一个硬件,通过复制X轴刻度所描述的服务确保每个服务至少运行在两个或者多个实例上。但是,这并不总是那么容易。让我们追溯编程步骤的单例模式。虽然不是所有的单例类都会阻止服务在多个服务器上运行,但是有一些实施绝对会避免可怕的后果。举个简化的例子,如果在处理从用户账户扣减资金的代码中有个类,可能会对此实施一个单例,以防止像用户账户余额为负数这样不愉快的事情发生。如果我们将此代码放在两个独立的服务器上,而不实施额外的控制或设置信号量,两个并发的事务有可能会都从用户账户上扣款,从而导致错误或不希望的情况发生。因此,要么修复代码来处理这种情况,要么依靠外部的控制来防止。最理想的解决方案是修复代码,以便在许多不同主机上实施服务,通常我们需要迅速修复代码以解除SPOF。作为本规则最后的重点,我们下一步将讨论一些快速修复的方法。


第一个和最简单的解决方案是采用主动/被动配置。将服务部署在主动服务器上运行,同时也部署在不处理流量的被动服务器上。热/冷配置通常用在数据库上作为去除SPOF的第一步。下一个选择是使用系统中的另一个组件来控制数据访问。如果数据库是SPOF,可以配置成主/从模式,应用可以控制数据访问,由主数据库完成写入/更新,由从数据库完成阅读/选择。除了消除SPOF,引入具有高读写比的只读数据库副本将减少主数据库的负载,并可以利用更经济实用的硬件,如第3章中规则11所讨论的那样。可以解决SPOF问题的最后一种配置是采用负载均衡器。如果网络或应用服务器上的服务是SPOF而且无法在代码中解决,通常可以采用负载均衡器,来解决用户请求只能由服务池中一台服务器来服务的问题。这可以通过设置在用户浏览器中的会话cookie来完成,利用负载均衡器把用户的每次请求重定向到相同的网络或应用服务器上,从而确保状态的一致性。


我们讨论了当无法及时通过修改代码解决SPOF时,几种可以快速实施的解决方案。尽管最佳而且最终的解决方案应该是修复代码,以允许服务的多个实例运行在不同的物理服务器上,但是首先是要尽早消除SPOF。记住,“一切皆可以出故障”,所以当修复SPOF的方案失败时,不要感到惊讶。


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
相关文章
|
19天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
32198 117
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
9天前
|
应用服务中间件 API 网络安全
3分钟汉化OpenClaw,使用Docker快速部署启动OpenClaw(Clawdbot)教程
2026年全新推出的OpenClaw汉化版,是基于Claude API开发的智能对话系统本土化优化版本,解决了原版英文界面的使用壁垒,实现了界面、文档、指令的全中文适配。该版本采用Docker容器化部署方案,开箱即用,支持Linux、macOS、Windows全平台运行,适配个人、企业、生产等多种使用场景,同时具备灵活的配置选项和强大的扩展能力。本文将从项目简介、部署前准备、快速部署、详细配置、问题排查、监控维护等方面,提供完整的部署与使用指南,文中包含实操代码命令,确保不同技术水平的用户都能快速落地使用。
4721 4
|
15天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
6821 18
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
14天前
|
人工智能 机器人 Linux
OpenClaw(Clawdbot、Moltbot)汉化版部署教程指南(零门槛)
OpenClaw作为2026年GitHub上增长最快的开源项目之一,一周内Stars从7800飙升至12万+,其核心优势在于打破传统聊天机器人的局限,能真正执行读写文件、运行脚本、浏览器自动化等实操任务。但原版全英文界面对中文用户存在上手门槛,汉化版通过覆盖命令行(CLI)与网页控制台(Dashboard)核心模块,解决了语言障碍,同时保持与官方版本的实时同步,确保新功能最快1小时内可用。本文将详细拆解汉化版OpenClaw的搭建流程,涵盖本地安装、Docker部署、服务器远程访问等场景,同时提供环境适配、问题排查与国内应用集成方案,助力中文用户高效搭建专属AI助手。
4780 11
|
16天前
|
人工智能 机器人 Linux
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!
5679 21
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
|
12天前
|
人工智能 JavaScript 安全
Claude Code 安装指南
Claude Code 是 Anthropic 推出的本地 AI 编程助手,支持 Mac/Linux/WSL/Windows 多平台一键安装(Shell/PowerShell/Homebrew/NPM),提供 CLI 交互、代码生成、审查、Git 提交等能力,并内置丰富斜杠命令与自动更新机制。
4273 0
|
16天前
|
存储 人工智能 机器人
OpenClaw是什么?阿里云OpenClaw(原Clawdbot/Moltbot)一键部署官方教程参考
OpenClaw是什么?OpenClaw(原Clawdbot/Moltbot)是一款实用的个人AI助理,能够24小时响应指令并执行任务,如处理文件、查询信息、自动化协同等。阿里云推出的OpenClaw一键部署方案,简化了复杂配置流程,用户无需专业技术储备,即可快速在轻量应用服务器上启用该服务,打造专属AI助理。本文将详细拆解部署全流程、进阶功能配置及常见问题解决方案,确保不改变原意且无营销表述。
6239 6