带你读《存储漫谈Ceph原理与实践》第三章接入层3.2对象存储RGW(六)

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
简介: 《存储漫谈Ceph原理与实践》第三章接入层3.2对象存储RGW(六)

3.2.6      未来展望

 

1.  RGW优势

 

CephRGW 在不断引入新功能的情况下,经历几次大规模的重构,整个架构设计分层清晰、责任明确,保证了整个RGW的可演进。RGW 当前的架构也充分考虑了非功能性的需求。

RGW通过引入 beastHTTP服务器前端以及使用 librados异步 API,逐渐向读写路

径异步化的方向演进。

在可观测性方面,RGW 也是在多个层面提供了支持。对于集中状态收集方面,得益于CephMGR组件的集成,RGW支持上报状态信息到MGR 中,为之后进一步导出观测指标到 MGR提供了支撑。

在运行时状态统计方面,RGW提供了adminsocket支持,支持单个RGW实例导出运行时的各类统计结果。

对于在线的请求跟踪分析方面,RGW也集成了基于 Jaeger的分布式请求跟踪。

在可管理性方面,RGW支持命令行管理工具 radosgw-adminHTTP协议的管理API。Ceph社区也在呼吁 radosgw-admin集成到 Ceph管理命令中,进一步简化用户使用方式。

在功能扩展性方面,RGW支持  Luascripting,可进行自定义的处理。这很容易让人联想到 Nginx社区和 OpenResty社区,期待 RGW的功能扩展性能催生出对象存储的OpenResty。

2.  RGW劣势

 

RGW扩展性得益于 HTTP 协议的无状态,因此基于 RGW的对象存储的扩展性约束主要来自于 RADOS层。目前 RGW 还没有解决好单个存储类别下的容量扩展性问题,具体来说就是一个存储桶中的对象只能保存在单个RADOS 集群中,单个RADOS集群容量是单个桶支撑容量的上限。大部分用户选择通过业务改造,使用多个存储桶来规避单个RADOS集群的容量上限。

除了容量扩展性之外,社区版本存在元数据扩展性问题,也就是单桶能容纳的对象个数受限于单个RADOS集群的限制。

单桶元数据管理还存在可用性缺陷。在保存元数据的RAODS集群中,存在 OSD异常下线后,恢复业务压力对读写请求造成严重影响,继而造成恢复期间请求错误率飙升、请   求时延剧烈抖动的问题。问题的根本原因在于索引信息以RADOSOMAP接口的形式保存,而对象的 OMAP 不支持异步恢复。大部分用户选择创建无索引类型的存储桶来规避存储桶索引的问题。

CephRGW的多数据中心冗余方案历经多年的发展,虽然已经演进到V2版本,但效果距离商用仍有距离,主要是因为RPO/RTO存在达标缺陷和成本缺陷。对于成本缺陷来说,RGW多数据中心的痛点主要在于采用了两中心全量镜像的方式,在 PB规模下的成本基本是不可接受的。对于RPO/RTO 达标缺陷来说,RGW 多数据中心采用异步复制的方式,无法为多站点业务提供RPO为零的保证。正是这两点缺陷,限制了 RGWPB规模并且SLA要求的对象存储场景上的落地。


3.  小结

 

虽然,我们在使用过程中发现了RGW有诸多待改进之处,但这依然不影响RGW目前特性最丰富的优秀对象存储开源实现。相信上述提及的问题被更多的使用者发现,并且得到社区的重视之后,一定会得到解决。

与此同时,RGW的诸多与时俱进的新兴特性不仅是对 RGW 架构演进能力的例证,同时也彰显了整个 RGW社区的活力和创新性,因此我们有理由相信 RGW 一定会越来越好。

 

相关实践学习
对象存储OSS快速上手——如何使用ossbrowser
本实验是对象存储OSS入门级实验。通过本实验,用户可学会如何用对象OSS的插件,进行简单的数据存、查、删等操作。
相关文章
|
4月前
|
存储 人工智能 Cloud Native
阿里云渠道商:OSS与传统存储系统的差异在哪里?
本文对比传统存储与云原生对象存储OSS的架构差异,涵盖性能、成本、扩展性等方面。OSS凭借高持久性、弹性扩容及与云服务深度集成,成为大数据与AI时代的优选方案。
|
6月前
|
存储 运维 安全
阿里云国际站OSS与自建存储的区别
阿里云国际站对象存储OSS提供海量、安全、低成本的云存储解决方案。相比自建存储,OSS具备易用性强、稳定性高、安全性好、成本更低等优势,支持无限扩展、自动冗余、多层防护及丰富增值服务,助力企业高效管理数据。
|
9月前
|
存储 人工智能 Kubernetes
AI 场景深度优化!K8s 集群 OSSFS 2.0 存储卷全面升级,高效访问 OSS 数据
阿里云对象存储OSS是一款海量、安全、低成本、高可靠的云存储服务,是用户在云上存储的高性价比选择…
|
10月前
|
存储 Kubernetes 对象存储
StrmVol存储卷:如何解锁K8s对象存储海量小文件访问性能新高度?
如何提升海量文件的数据读取速率,对于AI训练集管理、量化回测、时序日志分析等场景尤为重要。阿里云容器服务(ACK))支持StrmVol类型存储卷,基于底层虚拟块设备及内核态文件系统,显著降低海量小文件访问延迟。
|
9月前
|
存储 人工智能 测试技术
AI 场景深度优化!K8s 集群 OSSFS 2.0 存储卷全面升级,高效访问 OSS 数据
OSSFS 2.0通过轻量化协议设计、协程化技术及FUSE3低级API重构,实现大文件顺序读写与小文件高并发加载的显著提升,在实际测试中表现出高达数十倍的吞吐量增长。适用于机器学习训练、推理等对高带宽低延迟要求严苛的场景,同时支持静态和动态挂载方式,方便用户在ACK集群中部署使用。
977 34
|
8月前
|
存储 关系型数据库 MySQL
成本直降30%!RDS MySQL存储自动分层实战:OSS冷热分离架构设计指南
在日均订单量超500万的场景下,MySQL数据年增200%,但访问集中在近7天(85%)。通过冷热数据分离,将历史数据迁移至OSS,实现存储成本下降48%,年省72万元。结合RDS、OSS与Redis构建分层架构,自动化管理数据生命周期,优化查询性能与资源利用率,支撑PB级数据扩展。
581 3
|
存储 对象存储 云计算
|
6月前
|
存储 域名解析 前端开发
震惊!不买服务器,还可以用阿里云国际站 OSS 轻松搭建静态网站
在数字化时代,利用阿里云国际站OSS可低成本搭建静态网站。本文详解OSS优势及步骤:创建Bucket、上传文件、配置首页与404页面、绑定域名等,助你快速上线个人或小型业务网站,操作简单,成本低廉,适合初学者与中小企业。
|
机器学习/深度学习 人工智能 专有云
人工智能平台PAI使用问题之怎么将DLC的数据写入到另一个阿里云主账号的OSS中
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

热门文章

最新文章