基于 PolarDB 开源生态的可信安全数据库一体机

本文涉及的产品
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: 本文整理自莲子数据硬件系统首席架构师许长魁,在 2022 阿里巴巴开源开放周上的分享。本篇内容主要分为三个部分: 1. 项目背景 2. 研究进展 3. 未来规划。

本文整理自莲子数据硬件系统首席架构师许长魁,在 2022 阿里巴巴开源开放周上的分享。

本篇内容主要分为三个部分: 1. 项目背景 2. 研究进展 3. 未来规划。



一、项目背景:行业发展现状与项目研发驱动

莲子数据PolarDB 数据库一体机的立项得益于阿里云 PolarDB 开源计划的激励。PolarDB for Posgre SQL版本与莲子数据产品有着非常好的兼容性,保证了数据库一体机的软硬件适配工作得以顺利开展。数据库一体机主要包含三个方面的六大特点,即开放与异构、高效与节能、可信与安全。

1. 开放与异构

随着数据维度的扩张,业务对于算力也提出了更高要求。而随着摩尔定律的放缓,所有类别的处理器想要借助先进制程达到性能提升的技术路线难度也越来越大,但是 AI 自动驾驶和高性能计算对于计算性能的要求却越来越高。由此可见,单一的计算架构已经很难满足如今多元化的需求,而这一方面催生了存算分离的架构,另一方面也推动了异构计算的高速发展。



国内外的企业和研究机构对超域异构计算此类新一代的计算体系均进行了技术与产业布局。国外方面,英特尔和ARM均提出了“XPU”的概念,但侧重点略有不同。Intel 主要利用不同的架构处理不同类型的数据,根据处理速度或者带宽的要求进行优化。ARM则强调了全面计算的理念,对XPU的定义更多侧重于开放的数据融合计算平台,强调了对于数据流的处理、跨域计算以及多元的算力扩展。



NVIDIA 在超域异构计算方面主推的是NVLink 以及基于NVLink的NVSwitch芯片,用于 CPU、GPU 以及 GPU 集群之间的高速通信。

国内方面,阿里云作为国内超域异构计算的代表建设了基于CIPU的计算体系。与国外厂商不同的是,CIPU是一种云原生的全新计算体系架构,CIPU向下云化管理数据中心的硬件,加速了计算、存储和网络资源的调度,向上能够接入飞天云操作系统。相比于其他芯片公司,阿里云在实现 CIPU 与云操作系统的深度融合上具备了先天优势。一方面,它具备对底层基础设施资源的虚拟化管理能力,另一方面能够承载飞天对此类资源的编排和调度需求,并且具备存储、网络、计算、安全等硬件的加速能力。

从异构计算的国内外相关布局可以看出,异构计算的本质是将不同架构的处理芯片整合到一个系统上进行工作,具体实施上包含两个方面的含义。其一是板级的集成方式,将CPU、GPU、FPGA等置于一个板上进行组合;其二是芯片及封装级的集成方式。两个内涵分别涉及到数据总线技术和电子封装技术。



数据总线技术上,PCIe总线经过几十年的发展,已经进入5.0时代,拓展到计算存储加速的方方面面,6.0 已处于推广阶段,7.0标准也正在制定中。CXL 又是基于 PCIe5.0 发展而来的一套服务于高性能计算机和数据中心领域的超高速互联新标准,主要用于 CPU 和加速芯片比如GPU、 FPGA等之间的通信能力,能够显着改善多路 CPU和加速卡之间的通信能力,从而保证更低的延迟和内存一致性。2022 年最新提出的UCIe 互联标准,其目的是解决Chiplet 之间互联的行业标准问题。UCIe、PCIe 与 CXL进行协同,指明了 UCIe在封装内的Chiplet方向和封装外的Off Package 应用方向。

从本质上来说, CXL 基于PCIe发展而来,UCIe的提出也离不开 PCIe 和 CXL 总线的应用铺垫。但是 UCIe 的出现能够统一机柜内互联的物理标准,将 In Package 和 Off Package 统一到整体的框架中,也即一体机硬件研发的架构演进方向。

封装内互联也是 UCIe发挥的另一主场。Chiplet是未来混合异构芯片系统的重要单元,与之相似的另一概念为 system-in-package,即SIP封装。SIP封装是将芯片的最小系统进行系统级的二次封装,除了异构的芯片之外,还包含了一些必要的外设和内存单元,以上均为封装内互联的范畴。



我们的工作主要聚焦于板级和机柜空间数据互联的技术方案,期望打造开放的异构数据交换平台。


2.可信与安全

网络安全的风险源于图灵机原理缺少攻防的理念,这是先天性的不足。并且在设计计算系统时,也无法穷尽所有逻辑组合,必定会存在逻辑不全的缺陷。因此,需要通过安全可信的计算,在实时运算的同时进行免疫的安全防护,使得存在的缺陷不被攻击者所利用,从而达到预期的计算目标。



可信计算是 1999 年由 IBM、Intel 和 Microsoft 等牵头成立的国际 TCPA组织,后改名称为 Trusted Computing Group (TCG) 组织。该组织于 12 年发布了 TPM 2.0 标准,能够兼容中国的加密算法。后续在Intel 的不断推动下,它也成为了欧盟电信运营商设备采购的必要条件。



我国的可信计算从 1992 年开始立项, 06 年发布了可信计算平台的密码技术方案和可信计算密码智能平台功能与接口规范。先后经过了 1.0 阶段和 2.0 阶段,目前已经发展到 3.0 阶段。



与此同时,近五年在立法和规章的角度也进一步增强了对于可信安全计算的强制性要求。因此,我们认为可信计算需要以双模、软硬一体的方式融入到数据服务中,以提高可信度、安全度和隐私度。



3. 高效与节能


对于数据中心而言,能源成本已经占据了数据中心总成本的一半。因此,减少碳排放既是企业的社会责任,也是提高经济效益的手段。数据中心的高质量发展首先要着眼于提升能效,同时还要兼顾可扩展性、可靠性、安全性等方面的问题。因此,它的建设是一个庞大的系统工程。



节能方面,ARM处理器与X86 相比表现出了明显优势,在同等能耗水平下,ARM处理器仍能够提供相当的算力水平,这一点从此前蝉联四次全球冠军的富岳超算系统上也能够得以体现。亚马逊的 Graviton和阿里云的倚天 710 中也能看到基于 ARM 架构实现节能降碳的设计思路。

数据中心作为支撑企业业务的核心资产,其建设成本和运营质量直接关联企业的资金投入产出比。数据中心的绿色节能化趋势不仅仅是有益于社会和环境层面,对于数据中心企业而言也具备重要的意义。绿色节能化意味着数据中心基础设施的建设更加灵活,运营将更少地依赖传统电网,相关 IT 设备的能耗水平更低,自动化和智能化将体现在运营的各个环节。这些趋势都将为企业带来强大的市场竞争力,并且在长期维度上降低企业拥有数据中心的总拥有成本。数据中心的节能解决方案可以分为建设模式节能、制冷系统节能、供配电系统节能、 ICT 的设备节能以及 AI 应用等技术创新。我们的设计主要为设备节能技术路线。



二、研究进展:PolarDB数据库一体机项目详述

莲子数据的数据库一体机采用基于众核架构的ARM CPU ,遵循arm v8指令集,搭配ECC内存能够胜任企业应用级别的稳定性要求,且仅有 5 瓦的功耗,单颗 CPU 能够提供高达 38GFlops/瓦的计算能力,性能功耗比是行业平均水平的 3-8 倍。我们可以利用四颗 CPU 进行平行计算,虽然 4 颗 CPU 只能达到其他产品的一颗 CPU 的算力水平,但仅有 20 瓦功耗,而同类产品达到相同算力可能需要近百瓦的功耗。



在数据互联特性上, CPU 间采用了基于 PCIe 的数据总线,也开发了 Dynamic Data Transmission Over PCIE 的异构互联机制,实现了板级设备的高速数据传输。典型机型中,在不到 2U 的空间中集成了 8 个高密度的计算机节点单元,外加相当于万兆交换机的网机互联模块的高速通讯能力。该配置非常适用于云、边、端一体化计算的工业场景中。

传统的数据交换路径以 CPU 为中心, PCIe 的数据交换和以太网的数据交换互相分离,数据交换存在很多绕路行为。而数据互联方案采用了非 CPU 中心化的数据交换路径, 数据传输路径延迟降低50%,TCP/IP 的延迟降低90%。



在存储外设方面,我们基于 PolarDB 的存算分离架构,采用了SAN存储器来进行数据的分离存储,并且对数据读写的路径和空间均进行了优化,增强了数据校验的机制,同时也优化了缓存策略,以满足 QoS 的需求。此外,也优化了在线全局重删的功能,根据读写频度重新选择重删区域,不影响业务的访问性能,删除重复数据前会进行二次比对,避免数据丢失。通过存储系统内置的数据压缩功能模块,对数据进行压缩处理时前端业务系统无感知。上述配置缓解了存储系统的空间增长问题,降低了成本,也从另一方面降低了存储系统的能耗指标。

在可信安全方面,我们通过两部分构建了可信根和可信软件基。系统通过对应用透明的主动可信监控机制来保障应用的可信运行,不修改原应用,而是通过制定策略进行主动实时防护,对业务的性能影响非常小。



基于以上软硬件布局,我们实现了基于可信计算的数据库设备的主动防护。利用可信芯片实现硬件隔离,将安全保护与宿主系统分离,防止安全机制被旁路。同时利用了 USB、PCIE 等标准化的可信根实现了即插即用。可信根通过可信总线与三节点一体机进行通信,利用可信软件基实现芯片级和内存级的可信度量,硬件层的度量实现真正的免疫高级未知攻击的功能。同时,在可信防护中也采用了轻量级的加密技术,减少了密码的运算开销,降低了性能损耗,能够有效应对野外设备性能受限状况下的加密保护场景。



针对可能存在的篡改,可以通过主机的安全防护实现用户、程序、文件、服务、注册表等的访问控制。针对未知危害,可以通过建立核心程序防护来严禁未知程序的执行,从而实现对于未知程序的主动免疫。



基于以上三方面的能力,我们也进行了 ARM 架构的数据库一体机硬件条件下可信安全 PolarDB 的HTAP性能测试。鉴于 CPU 的平行计算特性,我们在测试中选取了最严苛的条件——每个节点单颗 CPU 在 5 瓦超低的功耗性能下,测试了三节点 PolarDB 的性能,操作系统搭载龙蜥 7.9 ,测试工具使用 Benchmark SQL 5.0 和 dbgen,分别进行了 TPCC 测试和 TPCH测试。



TPCC 测试结果显示,测试过程性能输出较为平稳。对比同一硬件条件下的 PG 单机版, PolarDB 采用了分布式架构,由于一致性问题,其性能略低。虽然绝对数值看似不高,但本系统的功耗和成本远低于其他X86 的同类架构。因此,在常规应用中已经能够满足技术要求,尤其适合在边缘计算等工业或苛刻场景下的应用。



TPCH 测试结果显示,随着跨机并行数的增加,TPCH 性能几乎呈线性提升状态,直到并行数达到 CPU 的核心数。在并行数超过 CPU 的核心数之后,性能会有所下降。但是对比同一硬件条件下的 GTDB,在并行度一致的情况下,两者性能相当。



三、未来规划:围绕PolarDB生态的发展规划

在未来的工作中,莲子数据会紧紧围绕 PolarDB 的生态完善使用体验,同时积极拓展场景应用,充分发挥开放异构、节能高效和可信安全的特性。结合 5G 云边端协同的趋势,充分发挥人工智能和专家系统的优势,建立基于 AI 的数据观测机制和系统诊断机制,为专网场景和工业现场等相关需求而努力。



借助阿里云的开放平台,我们希望能够和同行携手共建开放合作的 PolarDB 大生态。感谢诸多合作伙伴为项目的持续优化作出的努力,同时也希望感兴趣的同行能够参与其中共同进步。

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
2天前
|
存储 关系型数据库 分布式数据库
PolarDB PostgreSQL版:商业数据库替换与企业上云首选
PolarDB PostgreSQL版是商业数据库替换与企业上云的首选。其技术架构实现存储计算分离,具备极致弹性和扩展性,支持Serverless、HTAP等特性。产品在弹性、性能、成本优化和多模处理方面有显著提升,如冷热数据自动分层、Ganos多模引擎等。已在汽车、交通、零售等行业成功应用,典型案例包括小鹏汽车、中远海科等,帮助企业大幅降低运维成本并提高业务效率。
22 13
|
2天前
|
容灾 关系型数据库 分布式数据库
PolarDB分布式版:与云融合的分布式数据库发展新阶段
PolarDB分布式版标志着分布式数据库与云融合的新阶段。它经历了三个发展阶段:从简单的分布式中间件,到一体化分布式架构,再到云原生分布式数据库。PolarDB充分利用云资源的弹性、高性价比、高可用性和隔离能力,解决了大规模数据扩展性问题,并支持多租户场景和复杂事务处理。零售中台的建设背景包括国家数字化转型战略及解决信息孤岛问题,采用分布式数据库提升高可用性和性能,满足海量订单处理需求。展望未来,零售中台将重点提升容灾能力、优化资源利用并引入AI技术,以实现更智能的服务和更高的业务连续性。
|
4天前
|
关系型数据库 分布式数据库 数据库
瑶池数据库大讲堂|PolarDB HTAP:为在线业务插上实时分析的翅膀
瑶池数据库大讲堂介绍PolarDB HTAP,为在线业务提供实时分析能力。内容涵盖MySQL在线业务的分析需求与现有解决方案、PolarDB HTAP架构优化、针对分析型负载的优化(如向量化执行、多核并行处理)及近期性能改进和用户体验提升。通过这些优化,PolarDB HTAP实现了高效的数据处理和查询加速,帮助用户更好地应对复杂业务场景。
|
2天前
|
运维 关系型数据库 分布式数据库
阿里云PolarDB:引领云原生数据库创新发展
阿里云PolarDB引领云原生数据库创新,2024云栖大会将分享其最新发展及在游戏行业的应用。PolarDB凭借弹性、高可用性、多写技术等优势,支持全球80多个站点,服务1万多家企业。特别是针对游戏行业,PolarDB助力Funplus等公司实现高效运维、成本优化和业务扩展。通过云原生能力,PolarDB推动游戏业务的全球化部署与快速响应,提升用户体验并保障数据安全。未来,PolarDB将继续探索AI、多云管理等前沿技术,为用户提供更智能的数据基础设施。
|
5天前
|
关系型数据库 Serverless 分布式数据库
瑶池数据库微课堂 | PolarDB Serverless弹性&价格力观测
瑶池数据库微课堂介绍阿里云PolarDB Serverless的弹性与性价比优势。通过瑶池解决方案体验馆,用户可免费实操,直观感受Serverless的秒级弹性及超高性价比。内容涵盖Serverless概念、操作步骤、压测演示及性能曲线分析,展示PolarDB在不同负载下的自动扩展能力。适合希望了解云数据库弹性和成本效益的技术人员。
|
27天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
55 3
|
27天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
63 3
|
27天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
84 2
|
1月前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
260 15
|
1月前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。

热门文章

最新文章

相关产品

  • 云原生数据库 PolarDB