带你读《存储漫谈:Ceph原理与实践》——1.1.1 集中式存储系统

本文涉及的产品
文件存储 NAS,50GB 3个月
简介: 带你读《存储漫谈:Ceph原理与实践》——1.1.1 集中式存储系统

第一篇  理  论  篇

第1章 分布式存储概述


1.1 存储系统的架构演进

云计算与大数据技术的发展,推动存储系统架构的持续演进,存储系统从最原始的基于主机的架构逐步向网络化、虚拟化方向发展,存储系统更加关注性能、效率、灵活性、安全性的提升,而这些特性都需要好的存储架构来满足。

粗略分类,存储架构的演进可以划分为以下两个阶段。

第一阶段:从离散化到集中化的演进(从 DAS 到 SAN/NAS)。

互联网发展初期,存储需求相对简单,数据规模较小,存储系统架构以存储介质直连服务器(Direct-Attached Storage,DAS)为主,存储介质直接挂载到服务器的总线上来提供数据访问服务,数据存储设备与服务器是一种“同生共死”的状态。

这种方式可以简洁地解决数据的存储需求,但也存在着较为明显的弊端。

服务器之间的存储系统形成“孤岛”,限制数据的共享访问;

随着 CPU 处理能力逐步增强,SCSI 连接通道会成为 I/O 的瓶颈,制约性能发挥;

随着数据量增长,存储的安全性(备份 / 恢复需求)、扩展性问题日益凸显。

基于以上症结,存储区域网络(Storage Area Network,SAN)架构以及网络附属存储(Network Attached Storage,NAS)架构应运而生。

图 1-1 展示了 DAS、SAN、NAS 使用方式的差异。

image.png

图 1-1 DAS、SAN、NAS 使用方式示意

SAN 是一种专门为存储建立的独立于 TCP/IP 数据网络之外的专用网络,连接服务器和磁盘阵列设备,提供高速的数据传输,存储设备在服务器侧以块存储设备形式展现。目前常见的 SAN 有 IP-SAN 和 FC-SAN(FC 是指 Fibre Channel,光纤通道),其中 IP-SAN通过 TCP 协议转发 SCSI(Small Computer System Interface,小型计算机系统接口)协议,FC-SAN 通过光纤通道协议转发 SCSI 协议(采用光纤接口,可以提供更高的带宽)。SAN的结构允许任何服务器连接到任何存储阵列,不管数据放置在哪里,服务器都可以直接存取所需的数据,这样的方式也便于系统的统一管理以及集中控制。成本与复杂性是 SAN 存储架构较为明显的缺陷。

NAS 是连接在网络上具备数据存储功能的装置,因此也称为“网络存储器”,可提供跨平台文件共享功能。NAS 以数据为中心,将存储设备与服务器彻底分离,集中管理数据,存储设备在服务器侧以文件系统形式展现。NAS 本身能够支持多种协议(如 NFS、CIFS、FTP、HTTP 等),而且能够支持各种操作系统。NAS 数据存储适用于需要通过网络将文件数据传送到多台客户机上进行访问的用户,可以提供高效的文件共享服务。NAS 的缺点也较为明显,扩展性受到设备大小的限制,且只能提供文件级访问,无法满足 block 级应用的使用需求。

第二阶段:从集中化到虚拟化的演进(从 SAN/NAS 到分布式存储系统)。

SAN/NAS 解决方案的出现,实现了存储系统集中化建设及统一化管理的诉求,为规模化的数据中心基础设施建设提供了便捷途径。数据中心建设过程中不可避免地会出现采购规范多元化、设备型号多样化的情况,存储设备的兼容性问题、异构硬件的统一性问题会给企业的数据运维带来棘手的挑战。

存储虚拟化技术应运而生,其核心思想是将资源的逻辑映像与物理存储分开,通过存储系统或存储服务内部功能进行抽象、隐藏和隔离,屏蔽不同物理设备的异构属性,实现数据服务与物理硬件的独立管理,如图 1-2 所示。

image.png

图 1-2 存储虚拟化示意

分布式存储系统是存储虚拟化技术的常见展现形式,分布式存储系统将数据分散存储在多台独立的设备上,并对外提供统一的存储服务。分布式存储系统具有高度的可伸缩性以及可扩展性,具有强大的数据访问性能,且对标准化硬件支持更好,允许大规模存储系统可以通过相对低廉的成本进行建设与运维。

抛开存储系统架构演进的萌芽阶段的方案(DAS 存储方案),可以将存储系统架构分为传统的集中式存储系统以及新兴的分布式存储系统两大类,二者有较大的差异,表现在:

◆ 传统的存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要;

◆ 分布式存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负载,利用索引定位数据存储位置信息,不但提高了存储系统的可靠性、可用性以及数据存取效率,还更易于扩展。

1.1.1  集中式存储系统


传统的存储也称为集中式存储,从概念上可以看出其架构具有集中性,也就是整个存储是集中在一个系统中的。但集中式存储并不一定只是一台单独的设备,也可以是集中在一套系统当中的多个设备,如图 1-3 中的 SAN 存储方案就使用了几个机柜来存放数据。在集中式存储系统中包含很多组件,如机头(控制器)、磁盘阵列(JBOD)、交换机以及管理设备等,如图 1-4 所示。

集中式存储系统中最为核心的部件是机头,机头中的控制器实现了集中式存储系统中绝大多数的高级功能,如对磁盘的管理、将磁盘抽象化为存储资源池、划分逻辑单元号(Logical Unit Number,LUN)给客户端使用等,通常机头中包含两个控制器,互为主备,避免硬件故障导致整个存储系统的不可用。机头中包含前端端口以及后端端口,前端端口对外连接,提供存储服务,后端端口为机头连接更多的存储设备,形成更大的存储资源池,扩充存储系统的容量。

机头作为集中式存储系统的统一入口,其处理能力及扩展能力决定了系统整体的定位,通常集中式存储系统只能提供有限的存储系统纵向扩展(scale up)1 能力,很难满足存储系统横向扩展(scale out)2 的需求。通常情况下,可以通过 scale up 方式来扩展单台服务协同运算,并通过负载平衡以及容错等功能来提高运算能力及可靠度。器的性能,满足业务的需求;一旦遇到服务器性能的瓶颈上限后,就需要转而求助于 scale out 方式来进一步满足要求。

1 scale up(纵向扩展)指企业大型服务器通过增加处理器等运算资源进行升级以获得对应用性能的要求。

2 scale out(横向扩展)指企业可以根据需求增加不同的服务器应用,依靠多台服务器

image.png

图 1-3 集中式存储系统示例

image.png

图 1-4 集中式存储系统组件示意

相关实践学习
使用DAS实现数据库自动扩容和回缩
暂无
相关文章
|
25天前
|
存储 缓存 前端开发
Django 后端架构开发:存储层调优策略解析
Django 后端架构开发:存储层调优策略解析
36 2
|
18天前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
50 9
|
19天前
|
存储 SQL Cloud Native
Hologres 的架构设计与工作原理
【9月更文第1天】随着大数据时代的到来,实时分析和处理数据的需求日益增长。传统的数据仓库在处理大规模实时数据分析时逐渐显露出性能瓶颈。为了解决这些问题,阿里巴巴集团研发了一款名为 Hologres 的新型云原生交互式分析数据库。Hologres 能够支持 SQL 查询,并且能够实现实时的数据写入和查询,这使得它成为处理大规模实时数据的理想选择。
40 2
|
21天前
|
存储 分布式计算 Hadoop
ChunkServer 原理与架构详解
【8月更文第30天】在分布式文件系统中,ChunkServer 是一个重要的组件,负责存储文件系统中的数据块(chunks)。ChunkServer 的设计和实现对于确保数据的高可用性、一致性和持久性至关重要。本文将深入探讨 ChunkServer 的核心原理和内部架构设计,并通过代码示例来说明其实现细节。
22 1
|
27天前
|
数据采集 存储 Java
Flume Agent 的内部原理分析:深入探讨 Flume 的架构与实现机制
【8月更文挑战第24天】Apache Flume是一款专为大规模日志数据的收集、聚合及传输而设计的分布式、可靠且高可用系统。本文深入解析Flume Agent的核心机制并提供实际配置与使用示例。Flume Agent由三大组件构成:Source(数据源)、Channel(数据缓存)与Sink(数据目的地)。工作流程包括数据采集、暂存及传输。通过示例配置文件和Java代码片段展示了如何设置这些组件以实现日志数据的有效管理。Flume的强大功能与灵活性使其成为大数据处理及实时数据分析领域的优选工具。
56 1
|
28天前
|
消息中间件 存储 SQL
Kafka架构及其原理
Kafka架构及其原理
68 1
|
2月前
|
存储 关系型数据库 算法框架/工具
Ceph 架构以及部署
Ceph 架构以及部署
111 26
|
2月前
|
NoSQL 算法 Java
(十三)全面理解并发编程之分布式架构下Redis、ZK分布式锁的前世今生
本文探讨了从单体架构下的锁机制到分布式架构下的线程安全问题,并详细分析了分布式锁的实现原理和过程。
|
2月前
|
NoSQL Redis
Redis 主从复制架构配置及原理
Redis 主从复制架构配置及原理
45 5
|
1月前
|
存储 缓存 Java
Eureka原理与实践:深入探索微服务架构的核心组件
在微服务架构日益盛行的今天,服务之间的注册与发现成为了保证系统高可用性和灵活性的关键。Eureka,作为Netflix开源的服务注册与发现框架,凭借其简单、健壮的特性,在微服务领域占据了举足轻重的地位。本文将深入剖析Eureka的原理,并通过实践案例展示其在实际项目中的应用,以期为开发者提供一个高端、深入的视角。

热门文章

最新文章