从又拍云看云存储服务的可用性

简介: “云”这个概念在今年非常的火热,2年前国内的云存储服务还只有又拍云存储一家,如今国内已不下十家,面对如此多的云服务商,选择云服务的标准成了大家比较关注的问题。又拍云在其维基上交流了一些心得:

“云”这个概念在今年非常的火热,2年前国内的云存储服务还只有又拍云存储一家,如今国内已不下十家,面对如此多的云服务商,选择云服务的标准成了大家比较关注的问题又拍云在其维基上交流了一些心得:

我们在六年的云服务经验基础上沉淀了三个词:安全稳定、快速、易用。


一、安全稳定

image.png

云服务的安全隐患大致会出现在两个方面:第一是服务的持续可用;第二是数据的丢失和泄漏。

今年很多云服务平台屡屡爆出服务宕机或丢失数据的问题,这让大家对国内云服务更加的不放心,

其实云计算并不应该存在这类严重问题,云计算的主要使命之一恰恰是解决稳定和安全隐患问题。如SAE类PaaS云计算平台是保障我们网站应用的正常服务,高度容错且可扩展,而又拍云存储则属IaaS类云计算平台,存储数据的稳定和安全保障是云存储最主要的工作。

先说持续可用性的保证问题。无单点是一个云服务的基础,而目前很多云服务是单点的,所以致使故障频发。一个真正的云计算平台至少应该保证有两个互相热备的数据中心,三分以上分布不同机柜和机房的数据,在机房引入的线路上也应该保证至少电信、联通有两根以上的线路。只有这样才能保证不论是机房断电、硬盘故障、还是断线,都能保持持续的访问。另外就是对于服务器集群的部署上要实现负载的均衡,可采用服务器HA互备,lvs进行4层负载,7层nginx进行一致性hash及冷热文件调度,一旦有服务器出现硬件故障,前端调度会自动识别并剥离出集群,确保不影响用户每一次的实际访问。


为充分发挥Nginx的7层代理的优势,我们在此基础上加入了较多的业务模块,如:一致性HASH模块,根据业务需求通过请求信息进行计算,把请求统一分发到后端缓存服务器,避免使用普通负载均衡方式而导致缓存命中率降低,可大大提高缓存集群的业务处理能力;缓存调度模块,基于LRU和MRU算法对全局的所有访问URL进行热度分类,从客户端发起的请求到达Nginx就能快速确定该请求是否属于热门缓存,而直接到SSD磁盘获取资源;统计模块,在Nginx内部对所有访问URL进行统计并汇总,定期向后端业务系统发送统计报告,使得我们可以对客户提供实时的流量统计查询服务,这也是服务计费的标准;


再说数据的安全和泄漏问题。安全性的解决主要是通过多样的备份机制,像云存储主要依托在不同服务器上实现动态的实时三备份,也就是说会自动搜寻用户的数据是否存在3份,如没有自动选取服务器生成,这种机制可以完全的保证数据的安全。数据泄漏是使用第三方云计算的最大忧虑,因为云计算的API开放性,决定了云计算服务在安全性上的隐患更加大。目前通用的解决办法是采用128位AES加密码保护,以及权限控制,但是其实目前还没有绝对的办法可以杜绝数据部署在云上的泄漏问题。云存储目前主要是托管用户的公开数据,及网站上本身提供给用户访问的数据。


二、快速

image.png

快速是互联网平台发展的基石,优秀的速度才能创造有利于增长的用户体验。但是传统的IDC部署方式下,受限于硬件规模和存储架构的影响,通常速度很难发挥。这时候云存储就能发挥作用了,其集群服务器部署的方式,能最大的发挥数据运算的效率。开发者在评估云存储服务的速度时,应该看看他们有没有全国分布的CDN加速网络,如果没有通常速度都无法保证,严格来说,云服务是需要具备CDN节点的。


再就是看这个云服务的CDN部署架构是否优良,这个对速度的影响非常大。云存储CDN架构采用各地方缓存节点、核心缓存层、中心数据机房,3层结构部署,前端智能DNS调度用户到该用户访问最快的节点,地方缓存节点会保持连接2个核心缓存机房做负载均衡及相互备用,避免单路网络问题。核心缓存机房通过多条线路互备到数据机房读取文件。


三、易用

云服务因为其弹性扩容的特点,大幅度降低了互联网平台的运维规划压力。但同时他也有可能需要做一些额外的对接开发,因此易用就非常重要。好的云服务会开放高度可用的API,让用户系统极容易与云平台对接。如果云平台的API不够优秀,会让开发者的对接成本以及后续维护成本都非常的高。最好的云服务,应该有一些基于云的处理功能,去帮助用户节省一些工作时间和成本。比如又拍云存储,我们做了10种缩略图自定义、文件防盗链、以及与各种第三方平台系统的对接插件,以使得用户易用性更高。


最后给大家一个建议,如何去选择云服务。我们知道亚马逊的云服务划分为EC2和S3两块,EC2专用于网站的计算,而S3专用于静态文件的存储。在国内目前还没有公司具备亚马逊这样的云服务能力,因此建议大家可以考虑把网站托管到云主机,而静态文件托管到云存储。而对于数据库这类有高要求的数据应用,还是建议大家使用托管的物理服务器,毕竟目前云主机的性能和稳定性方面仍有待观察。

相关文章
|
2月前
|
存储 数据可视化 物联网
拒绝"炼丹"玄学:一文读懂 LoRA、P-Tuning 与全量微调的核心差异
本文通俗解析大模型微调核心方法:全量微调(效果好但显存昂贵、易遗忘)、LoRA(冻结原权重,低秩矩阵高效适配,适合注入领域知识)、P-Tuning(学习软提示,擅长安排风格与指令)。厘清术语差异,给出实战选型建议与关键参数调优要点,助开发者跨越入门门槛。
|
2月前
|
人工智能 监控 搜索推荐
阿里云万小智建站使用教程:对话式AI建站,直接说需求,10分钟网站上线!
阿里云万小智是对话式AI建站工具,用户只需口述需求,10分钟即可完成网站搭建。教程涵盖四大阶段:域名备案(1–20工作日)、AI模板设计、一键发布上线、SEO推广与流量监控,全程零代码操作,新手友好。
425 5
|
3月前
|
大数据 测试技术 C++
CN2线路与普通线路区别详解:一文看懂核心差异
在跨境网络访问、服务器部署等场景中,“CN2线路”和“普通线路”是经常被提及的两个概念。对于企业开展跨境业务、个人追求稳定网络体验而言,了解二者的区别至关重要。本文将从概念定义、核心性能、适用场景等多个维度,全面解析CN2线路与普通线路的差异,帮助你根据自身需求做出合适选择。
|
运维 监控 数据挖掘
交换机镜像之MAC镜像,有哪些分类?
【10月更文挑战第2天】
389 1
交换机镜像之MAC镜像,有哪些分类?
|
11月前
|
数据采集 前端开发 JavaScript
深挖navigator.webdriver浏览器自动化检测的底层分析
本文详细讲解了如何通过技术手段破解浏览器 `navigator.webdriver` 检测,结合爬虫代理、多线程等策略,在豆瓣图书页面批量采集数据。具体包括:隐藏 Selenium 特征、配置代理突破 IP 限制、设置伪装用户、利用多线程提升效率。文章面向初学者,提供分步教程与示例代码,同时设有「陷阱警告」帮助规避常见问题。目标是从底层实现反检测,高效采集图书评分、简介、作者等信息,适合具备 Python 和 Selenium 基础的读者实践学习。
427 12
深挖navigator.webdriver浏览器自动化检测的底层分析
|
SQL Java 数据库连接
基于QueryWrapper的查询,查询出名字中带有o的,存款大于等于1000元的人的id、username、info、balance字段
基于QueryWrapper的查询,查询出名字中带有o的,存款大于等于1000元的人的id、username、info、balance字段
|
机器学习/深度学习 编解码 计算机视觉
RT-DETR改进策略【Backbone/主干网络】| 2023 U-Net V2 替换骨干网络,加强细节特征的提取和融合
RT-DETR改进策略【Backbone/主干网络】| 2023 U-Net V2 替换骨干网络,加强细节特征的提取和融合
729 10
RT-DETR改进策略【Backbone/主干网络】| 2023 U-Net V2 替换骨干网络,加强细节特征的提取和融合
|
存储 SQL 安全
大数据的隐私与安全:你的一举一动,都在“裸奔”?
大数据的隐私与安全:你的一举一动,都在“裸奔”?
339 15
|
弹性计算 负载均衡 应用服务中间件
slb健康检查域名配置
slb健康检查域名配置
291 7
|
机器学习/深度学习 人工智能 自然语言处理
生成式人工智能入门指南
生成式 AI 是人工智能的一个子领域,专注于通过学习现有数据的模式创建新内容或生成解决方案。它是一种鼓励 AI 系统利用对数据结构的理解自主生成新颖、类似于人类的输出的方法。这可以采用图像、文本、音乐或甚至是代码的形式呈现。
508 3