PolarDB-X 冷热数据归档(一)| 学习笔记

简介: 快速学习 PolarDB-X 冷热数据归档。

开发者学堂课程【PolarDB-X开源分布式数据库进阶课程 :PolarDB-X 冷热数据归档(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/1202/detail/18331


PolarDB-X 冷热数据归档

 

内容介绍:

一、PolarDB-X 简介

二、课程介绍

三、背景介绍

四、演示内容

五、演示

 

一、PolarDB-X 简介

首先这个是 PolarDB-X 整体的一个架构。

image.png 

二、课程介绍

image.png

这是之前我们做开源训练营的一个前景回顾

image.png

这页 PPT 是我们这个新版本所提供的一些特景。

image.png

还有我们相关的一些课程资源

 

三.背景介绍

我们这次主要介绍的是冷热数据的归纳,主要是围绕云栖实验室做一些介绍,如果想了解细节的内容可以观看群里面,八月份有一次直播会讲一些更加技术的东西。

数据时效性:随着时间推移,业务数据的热度会有明显的降低

存储成本:一般而言,为了支持高速存取,数据库的存储成本相对于 OSS 等冷存储是比较高的

归档问题:通过 delete 语句删除大规模数据,会造成锁表、产生大量 binlog、磁盘空洞等问题,是一个较危险的操作

冷数据查询:冷数据的分析处理能带来很多商业上的 insight,帮助用户作出决定

言归正传,冷热数据归纳其实是处理一些冷热分离的场景,在有些业务里面他的数据随着时间的推移热度会明显的降低,被查询的概率会小很多,但是 zhe ye 数据也是要存在数据库里的,数据库为了支持高速存取,一般会用固定硬盘它的存储成本是很高的,但是这些数据被查询的概率又很低有一些用户就会做定期的归档他们通常会使用delete语句来删除了,已经过期的数据 Delete 会造成锁表通常结束还需要来处理磁盘的空洞这个过程危险,而且漫长通常要凌晨爬起来处理这个归档的问题,用 delete 语句把数据删除之后这些冷数据,数据库就无法访问了。如果你想继续访问还得把它从存储的地方导入数据库,然后进行查询。这些冷数据其实会有一些商业上的作用,他的分析处理会帮用户做出更好的角色。

·存储引擎  

·CN直接读取冷数据表进行查询

·多种数据源  

·多级裁剪,较强的 TP 能力

·不支持直接删改,只通过 ddl 修改数据  

·列存结构,比 InnoDB 更强的 AP 能力

·底层基于 ORC 文件格式,完全兼容 MySQL 的类型系统

·任意时间点备份恢复

基于这样的痛点问题我们提供了一种冷数据表,要明确的是冷数据表,其实是和 InnoDB 并列的存储引擎。这一页PPT 大家要注意,如果考试的话题目题目都在这一页上。冷数据是可以实施多种数据源的,比如说我们在云上是用的oss,我们在实验室中开源的云起实验室中用的是 CN 的本地磁盘。如果在来源的批查地里面数据库还可以接 nfs,这个能力我们也来源出去了,包括也可以使用 s3 他并不限制使用哪种数据源,因为是冷数据,所以我们第3点不支持直接增删改他只能通过DDL修改数据,此外,我们数据表低层使用的 ORC 文件格式, 他是不能完全兼容 MySQI 的类型系统,因此我们对这个文件进行了模改,让他能够完全兼容 MySQI 的类型系统,当然这样的话那些开源的 orc 就无法访问了,我们生成了冷数据的 ORC 文件。

第四点我们的冷数据表是 cn 直接进行读取查询然后解析出来不会再介入 DN,所以它的性能是有保证的,为了能够有较强的 TP 能力,我们做了多层的裁剪,在实验中会显示 TP 能力,因为我们是基于 orc 的列存结构所以说他天然比 InnoDB  有更强的 AP 能力。最后一点作为一个数据库,他一定会有备份恢复的能力支持任意时间点的恢复。

image.png

在实验中我们会用到 Loading 模式和 TTI 模式的冷数据归档表,这两张都是在云起实验室中用到的,我们来解析一下,create table sbtest1……这一条会把这张表全量的复制,到当前库的 sbtest1,全量的复制到了一个冷数据表里,没有增量的能力,更方便我们对冷数据引擎直接测试性能,在云起实验中 TP 测试都是用的这种模式,实际上不是生产会用的模式,主要是用来测试的另外一种 TTL 模式,这张表要求 t_

image.png

必须是 TTL 的表,因为它有自动的冷数据过期能力,介入这样的表就会把过期的数据自动归档到 t_order_oss 中,这种表也称为归档表,它的性能可以用 sbtest1 验证,它TTL模式的表比 Loading 模式多了一个归档的增量这个过程是自动。

相关文章
|
6月前
|
人工智能 固态存储 IDE
Android Studio 2025 超详细安装图解:从零到汉化一步到位
Android Studio 2025(Narwhal)是谷歌推出的最新安卓开发IDE,界面更现代,支持AI辅助编码、Jetpack Compose升级、多设备模拟器,构建速度更快,适配折叠屏等新形态设备,全面提升开发效率。
3718 2
|
Java Maven Spring
【SpringBug】lombok插件失效,但是没有报错信息,@Data不能生成get和set方法
解决写了@Data注解,但是在测试文件中生成的反编译target文件Us二Info中没有get和set方法
1222 16
|
存储 SQL 关系型数据库
(六)MySQL索引原理篇:深入数据库底层揭开索引机制的神秘面纱!
《索引原理篇》它现在终于来了!但对于索引原理及底层实现,相信大家多多少少都有了解过,毕竟这也是面试过程中出现次数较为频繁的一个技术点。在本文中就来一窥`MySQL`索引底层的神秘面纱!
1073 7
|
算法 数据库
MYSQL-mybatisplus的主键自增问题与@Tableld@TableField@TableLogic的学习
关于org.apache.ibatis.binding.BindingException: Invalid bound statement (not found): com.laoyang.Mapper.BookMapper.deleteById问题
1064 116
|
小程序
微信小程序APPID的两种查看方法
查看微信小程序APPID的两种方法:1) 在小程序内点击右上角“...”,进入查看页面,点击“更多资料”查看;2) 登录微信公众平台([https://mp.weixin.qq.com/](https://mp.weixin.qq.com/)),进入【设置】查看“账号信息”。
16527 1
|
Java 数据库连接 Nacos
nacos常见问题之启动不了如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
2717 0
|
存储 SQL 负载均衡
达梦数据库与Oracle数据库:功能、性能和适用场景对比
数据库在现代信息技术领域中扮演着至关重要的角色。在企业级应用中,选择正确的数据库管理系统对于数据存储、处理和查询效率至关重要。本文将对比两个备受关注的数据库管理系统——达梦数据库和Oracle数据库,从功能、性能和适用场景等方面进行深入探讨,以帮助读者在选择合适数据库时做出明智的决策。
4182 1
|
芯片
第七章 输入/输出与中断【微机原理】2
第七章 输入/输出与中断【微机原理】2
553 0

热门文章

最新文章