Diskless:云与互联网数据中心的下一个大变革

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: Diskless:云与互联网数据中心的下一个大变革

作为数字经济的核心产业,云与互联网数据中心正面临着下一波技术浪潮的冲击:云原生应用和Serverless无服务器计算的全面普及,推动数据中心底层硬件资源彻底解耦池化和重组整合,形成新的扁平分层——新型存算分离硬件架构,这就是Diskless架构。

当前的云与互联网数据中心多采用计算存储一体化的服务器作为基础单元,不同服务器上的计算和存储硬件资源难以共享,利用率低下。而Diskless架构则让存储资源从服务器中独立出来形成新的共享硬件形态,整个数据中心形成了独立的算力模组、存储模组和网络模组等共享资源池,进一步提升整个数据中心的效率以及降低成本和能耗。

2022年12月22日,中国计算机协会(CCF)信息存储技术专委会、天翼云、中国电子云、华为、中科驭数等10余家企业机构联合主办《数据中心Diskless架构》白皮书发布会,首次全面探讨了Diskless架构。“《数据中心Diskless架构》白皮书系统地梳理了数据中心架构转型的背景和挑战,提出了一种新的数据中心架构模式——数据中心Diskless架构”,中国工程院院士郑纬民表示,“这份研究对于相关决策部门、企业界、学术界具有很好的启示和参考意义。”


数据中心的再变革

2022年是云原生技术迅猛推进的一年,特别是以Serverless无服务器计算为代表的云原生应用,彻底摆脱了对于底层硬件资源环境的依赖。2022年,各大云服务厂商纷纷宣布旗下核心云产品与服务的全面Serverless化。从容器化到Serverless化,云原生开始从软件层面全面变革数据中心。

云原生是自上而下,从软件层面改进数据中心的效率,然而这只解决了问题的一半。Diskless是对云与互联网数据中心资源的第二次效率革命,通过全面改变数据中心硬件组合形态,自下而上改进数据中心效率。实际上,随着海量数据的爆发和动态业务的增强,对于基础设施的灵活性和利用率提出全新的要求。

image.png

(传统存算一体服务器架构面临容量利用率三大挑战。图片来源:CCF)

CCF信息存储技术专委会主任、清华大学教授、厦门大学信息学院院长舒继武教授指出,当前的数据中心采用的是存算一体的服务器,导致计算与存储更新周期不匹配,系统扩展时资源得不到充分利用,还增加了数据迁移等工作;而支撑业务的服务器存储无论是性能型还是容量型,都无法同时实现高性能、高可靠性与高资源利用率等。此外,Serverless等新型分布式应用要求共享存储,各种IO处理占用算力而导致的“数据中心税”等等,都要求新的数据中心架构。

所谓Diskless架构,与传统存算分离架构相比,将原来服务器中的本地盘拉远,构成无盘化的服务器和远端存储池。Diskless架构彻底打破各类存算硬件资源的边界,将原有架构的多级分层资源进行彻底解耦池化和重组整合,形成新的扁平分层,简化了数据基础设施架构。同时,Diskless架构将通用CPU不擅长的任务卸载到各种专用处理器上,使硬件的组装更为灵活,从全局角度实现了硬件资源最优组合,彻底释放数据中心的效率,解决了现有数据中心的诸多问题。


数据中心Diskless架构化

根据《数据中心Diskless架构》白皮书,数据中心Diskless架构由无盘化的服务器、极高存力密度的存储系统、专用数据处理器和多样化的网络协议组成。Diskless架构分为三大分层:存储模组、算力模组和网络模组,提供高容量极简盘框、本地存储拉远池化、无盘化服务器、新型网络灵活组装等几大新兴能力。

(数据中心Diskless架构的定义。图片来源:CCF)

首先也是最重要的新型组件,就是存储型模组,换言之就是将本地盘或本地内存从服务器独立出来,拉到远程形成共享存储池或共享内存池。存储型模组主要以EBOF、EBOM(Ethernet Bunch of Memory)、EBOD(Ethernet Bunch of Disk)等新型盘框形态存在。而RAID、大比例纠删码算法等传统存储能力,也从服务器中独立出来,放置到存储型模组中,形成了“盘即存储”的大盘技术。存储型模组对外通过NoF等高速共享网络,提供块、文件等标准存储服务。

其次,网络模组对于Diskless架构来说十分重要,网络模组需要解决远程访问硬盘和内存的带宽和时延问题,满足Diskless架构下多种场景池化接入的诉求。例如,服务器本地盘可通过NoF高速网络,独立到远程的EBOF盘框中实现SSD池化,而内存资源池也可通过CXL等新型总线型网络构建PB级共享大内存,形成远程共享内存空间。

当然,将存储从服务器独立出去后,服务器的形态也将发生重大改变。目前,以DPU为代表的专用处理器,卸载了部分CPU功能,释放CPU算力,就是服务器形态的一种改变。引入DPU等专用处理器后的Diskless架构,必然促成CPU算力的池化,打破传统以CPU为中心的服务器架构。随着数据中心出现大规模的存储模组,服务器的形态还将进一步变化,至于将出现什么样的服务器新物种,这就有赖于业界厂商的创新力了。

简单理解,Diskless架构改变了数据中心各类硬件的组合形式,让数据中心的各个硬件组件彻底独立,可灵活组合,也就是在硬件层面实现了可组合式架构(Composable Infrastructure)。可组合式架构本来是软件的理念,但Diskless架构进一步将其推进到了硬件层面。相应的,数据中心各种硬件的远近关系、松紧耦合的变化,催生了场景化数据缩减、数控分离、盘芯协同、高通量网络、网存协同等一系列新技术,从而实现各硬件组件之间更好的协作。


推动数字经济的进一步扩展

《“十四五”数字经济发展规划》指出:到2025年,数字经济全面迈向扩展期。而作为一种新兴的可组合硬件架构,Diskless架构数据中心将推动数字经济的全面扩展。

云原生、大数据、数据库、虚拟化、高性能计算……这些都是数字经济核心场景,Diskless架构能够更好地实现这些场景下的数据中心效率最大化,从而以更大规模推动这些场景的扩展。《数据中心Diskless架构》指出:Diskless架构为云和互联网等应用带来高资源利用率、高可靠、高性能等价值。

(云和互联网的三类典型Diskless应用场景。图片来源:《数据中心Diskless架构白皮书》)

互联网业务平台通常承载视频、图片、数据库、AI分析、大数据等业务场景,在传统云架构中,IaaS层存储基于服务器本地盘,搭载Ceph分布式文件系统。Diskless架构在云和互联网的应用主要有三种典型场景:一是针对虚拟化业务,直接将服务器本地盘拉远,用Diskless存储模组替代服务器本地盘。二是为数据库、大数据等业务提供大内存,加速数据处理;三是针对容器等新业务场景,为Ceph等分布式应用提供文件语义,并将温热数据分级到更冷的EBOD等机械硬盘存储模组中,提升存储效率。

目前,Diskless架构还是一种新兴的数据中心架构,需要业界的共同支持。西部数据的OpenFlex Data24 EBOF盘框、华为微存储、英伟达的BlueField系列DPU和中科驭数的KPU等都是对Diskless的有力尝试。天翼云、中国电子云、中科驭数、华为、大普微等企业已积极投入到Diskless架构的实践中。


整体来看:在华为等业界厂商的努力推动下,数据中心Diskless架构有望成为下一代大型数据中心的建设标准,可以满足云、互联网、电信、金融等行业接下来全面进入数字经济扩展期的需求,同时迎接疫情后的全面云原生化,以更高效率、更低成本、更强敏捷力,打下硬实力!展望2023,可以预见,Diskless数据中心将是数字经济规模化扩展的新基建。

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
4月前
|
存储 人工智能 开发框架
认识什么是互联网数据中心(IDC)
互联网数据中心(IDC)拥有高速带宽、高性能网络与安全环境,提供服务器托管、租用等服务。它是数据存储与流通的核心,支持互联网内容提供商、企业和各类网站的大规模、高质量需求。机房维护涵盖多方面,确保设备稳定运行。中国IDC行业快速发展,机房按星级划分,从一星到五星,标准逐步提升,体现国家信息基础设施的进步与成熟。国际上,Uptime Institute的Tier等级进一步规范了数据中心的可用性与可靠性标准。
133 6
|
6月前
|
缓存 安全 数据中心
IDC许可证 互联网数据中心业务 增值电信业务许可证 办理流程
IDC许可证 互联网数据中心业务 增值电信业务许可证 办理流程
86 0
|
云安全 存储 运维
互联网变革的十字路口 数据中心面临混合云转型
互联网变革的十字路口 数据中心面临混合云转型
互联网变革的十字路口 数据中心面临混合云转型
|
弹性计算 负载均衡 容灾
【云栖号案例 | 互联网】多来点通过混合云构建异地双活架构数据中心
企业发展时数据库需要快速弹性扩容、构建IDC与云上跨地域双活架构。上云后异地双活容灾架构、快速弹性扩容,实现资源扩展,构建更多异地数据中心。
|
SQL NoSQL 测试技术
互联网模式下的测试数据中心,小白也能高效构造数据
11月2日,云效第三期Work Like Alibaba系列直播开启,阿里巴巴研发效能事业部云效技术专家何卫龙,分享了《测试数据中心-互联网模式下新型的数据准备引擎》,主要解决测试过程中数据准备困难,以及如何提升数据准备效率的思路和方法。
6453 0
|
4月前
|
机器学习/深度学习 存储 监控
利用机器学习技术优化数据中心能效
【7月更文挑战第36天】在数据中心管理和运营中,能源效率已成为关键性能指标之一。随着能源成本的不断上升以及环境保护意识的增强,开发智能化、自动化的解决方案以降低能耗和提高能源利用率变得尤为重要。本文探讨了如何应用机器学习技术对数据中心的能源消耗进行建模、预测和优化,提出了一个基于机器学习的框架来动态调整资源分配和工作负载管理,以达到节能的目的。通过实验验证,该框架能够有效减少数据中心的能耗,同时保持服务质量。