【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1|学习笔记(三)

简介: 快速学习【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1

开发者学堂课程【数据仓库 ACP 认证课程【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/928/detail/14623


【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1


(2)权限与数据安全∶用户

用户账号和认证︰

账号格式:ALIYUN$user_account@aliyun.com

认证需要使用AcclessKey

用户类型:

.OWNER:数据库拥有者,开通云原生数据仓库服务,并创建数据

用户∶被授权的数据库用户,由OWNER添加,无需开通云原生数据仓库服务

RAM子账号︰

支持RAM(阿里云访问控制)子账号登录和使用云原生数据仓库

主账号可建多个子账号,通过授予授权策略,使子账号在一定条件下可以访问云原生数据仓库

子账号访问云原生数据仓库的MySQL协议端时需要使用其的Access Key ID/Secret作为用户名和密码

(3)权限与数据安全∶权限模型

AnalyticDB for MySQL集群支持如下粒度的权限控制:集群、数据库、表、列、行级(基于视图)。

 

DB

T

Col

Comments

SELECT

查询数据

INSERT...SELECT...FR

OM...

执行Insert.Select权限

UPDATE

执行Update权限

TRUNCATE TABLE

×

执行Drop权限

SHOW

×

列出数据库、表、视图内部对象(Global、Database )、列出表内部对象 (Table[View] )

ALTER

×

修改表/视图/数据库定义

DROP

×

删除数据库、表或分区(Global、Database )、删除表或分区(Table[Group])

CREATE

×

创建数据库(Global )、创建表/表分区/视图(Database )

INSERT

执行Insert的权限

DELETE

执行Delete的权限

ALL[PRIVILEGES]

以上所有权限

(4)权限与数据安全:SQL审计

SQL审计功能可以实时记录数据库DML和DDL操作信息,并提供数据库操作信息的检索功能,提高云原生数据仓库AnalyticDB MySQL版的安全性。

SQL审计日志

记录对数据库执行的所有操作。通过审计日志记录,您可以对数据库进行故障分析、行为分析、安全审计等操作。

搜索

可以按照数据库、客户端IP、执行耗时、执行状态等进行多维度检索,并支持导出搜索结果。

网络异常,图片无法展示
|
3.智能索引

ADB为表的每个字段智能构建索引,目前支持五种类型∶字符串类的 Invert 索引、 bitmap.索引、数值类的KDTree索引、JSON索引和向量索引;不同类型的索引可以实现列级索引多种条件(交、并、差)任意组合,查询时无需建组合索引,通过Index CBO智能动态筛选索引下推,通过谓词计算层进行流式渐进多路归并输出

倒排索引∶分区表的所有列(适用Bitmap索引的列除外)都建了倒排索引,key为排序的列值,value为对应的RowID list,所以对于任何列进行FILTER(WHERE key=value)或者JOIN查询都非常高效。

Bitmap索引∶对于值重复率高的列,建立Bitmap索引。

KDTree索引∶为了加速范围查询,对于类型为数字的列同时建立了KDTree索引。

image.png(1)行列混存的块索引

(2)块索引即块的元数据信息︰

分区元数据︰分区总行数,单个block中的列行数等信息;

列元数据∶列值类型、整列的MAX/MIN值,NULL值数目,直方图信息等,便于加速查询;

列Block元数据︰该列的MAX/MIN/SUM

总条目数(COUNT)等信息,便于加速查询。

说明∶复杂类型数据(json , vector )存储采用统一大小的块组织存储,按顺序存,采用稀疏索引查询

image.png

4.数据存储冷热分离

(1)冷热数据分层

AnalyticDB可以按表粒度、表的二级分区粒度独立选择冷、热存储介质,AnalyticDB数据写入时,数据会首先进入热空间SSD上,当热存储数据积累到一定程度或者用户指定的冷表策略时会自动调度后台的Build任务,把数据迁移到冷存储空间。

冷数据指的是访问频次较低的数据,采用低价的HDD存储,满足存储空间的需求。

热数据指的是访问频次较高的数据,采用SSD存储,满足高性能访问的需求。

可以执行CREATE TABLE语句指定表的冷热存储策略为︰全热存储(数据全部存储在SSD )、全冷存储(数据全部存储在HDD )、冷热混合存储(指定一定数量的分区存储在SSD,其余数据存储在HDD )。

image.png创建表可以指定存储策,等于 Hot、Cold、Mixed代表不同的热数据,冷数据来混存,在混存时候需要指定热分区的个数,指定热分区个数为3,新来 的数据放入热分区中,继续放入会增多,其中一个会转HDD中存储

冷热分层

高性价比,完全按量付费

冷热策略轻松定义

只需指定表的冷热策略即可享有冷热存储能力,无需额外购买资源

冷热分区自动迁移

异步迁移,业务无感知,不影响读写

查询和内外部接口统一

在离线一体化,数据强一致

image.png(2)冷热数据存储诊断表

AnalyticDB MySQL版弹性模式集群版( 3.1.3.5及以上版本)支持数据的冷热分离存储,用户可以通过查表的方式查询某一张表的冷热数据存储布局情况。

查询所有表的存储状态∶

select * from information_schema.table_ usage;

查询单个表的存储状态︰

select * from information_schema.table_usage where

itable_ schema="$schema_name' and table_name='Stable name' 在表A中,数据有两个分片分布在两个不同的节点上,如果指定热分区是2,其实在每一个分片上面都满足这个热数据。分区的个数是2,但实际上热分区是p3p4p5

实际显示的hot_partition_count

大于用户定义的hot_partition_count。

5.物化视图

物化视图是数仓领域的核心特性之一。不同于逻辑视图( view ) ,物化视图( materializedview )会持久化视图的查询结果。

物化视图可用于加速分析,并能简化ETL,适用于多种场景,例如报表类业务,大屏展示需求,来自BI工具的查询等等。

创建物化试图的语法:

CREATE MATERIALIZED VIEW <mv_name>[MV DEFINITION]

[REFRESH COMPLETE [ON<DEMAND|OVERWRITE>][STARTWITH date][NEXT date]]

As

<QUERY BODY>;

#指定列建立索引,默认全部列建立索引

CREATE MATERIALIZED VIEW myview (INDEX(name),

PRIMARY KEY (id)

)DISTRIBUTED BY HASH (id)

AS

SELECT id, name, age FROM base;

#指定分区键和注释

CREATE MATERIALIZED VIEW c (name varchar(10),

value double,

KEY INDEX_ID(id)COMMENT "id",

CLUSTERED KEY INDEX(name, value),

PRIMARY KEY(id)

DISTRIBUTED BY hash(id)

PARTITION BY value(date_format(dat,"%Y%m%d"))

LIFECYCLE 30

COMMENT"MATERIALIZED VIEw c’

AS

SELECT * FROM base;

物化视图客户案例

使用物化视图降低客户查询延迟时间。举例生意参谋∶是阿里巴巴旗下为千万商家提供的一项重要产品服务,帮助商家及时分析店铺运营情况。尤其是在大促期间,面对突发的流量和海量的数据,数据分析尤为重要。

利用物化视图,可以大幅降低延迟时间。将每小时展示信息结果存储到物化视图中,每次查询只需要查询物化视图即可,平均每次查询时间降低至100毫秒。

image.png

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
4月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
国诚投顾携手阿里云,依托Serverless架构实现技术全面升级,构建高弹性、智能化技术底座,提升业务稳定性与运行效率。通过云原生API网关、微服务治理与智能监控,实现流量精细化管理与系统可观测性增强,打造安全、敏捷的智能投顾平台,助力行业数字化变革。
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
|
4月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。
|
3月前
|
存储 SQL 机器学习/深度学习
一文辨析:数据仓库、数据湖、湖仓一体
本文深入解析数据仓库、数据湖与湖仓一体的技术原理与适用场景。数据仓库结构严谨、查询高效,适合处理结构化数据;数据湖灵活开放,支持多模态数据,但治理难度高;湖仓一体融合两者优势,实现低成本存储与高效分析,适合大规模数据场景。文章结合企业实际需求,探讨如何选择合适的数据架构,并提供湖仓一体的落地迁移策略,助力企业提升数据价值。
一文辨析:数据仓库、数据湖、湖仓一体
|
2月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
3月前
|
存储 机器学习/深度学习 数据采集
数据湖 vs 数据仓库:大厂为何总爱“湖仓并用”?
数据湖与数据仓库各有优劣,湖仓一体架构成为趋势。本文解析二者核心差异、适用场景及治理方案,助你选型落地。
数据湖 vs 数据仓库:大厂为何总爱“湖仓并用”?
|
3月前
|
关系型数据库 MySQL 分布式数据库
阿里云PolarDB云原生数据库收费价格:MySQL和PostgreSQL详细介绍
阿里云PolarDB兼容MySQL、PostgreSQL及Oracle语法,支持集中式与分布式架构。标准版2核4G年费1116元起,企业版最高性能达4核16G,支持HTAP与多级高可用,广泛应用于金融、政务、互联网等领域,TCO成本降低50%。
|
4月前
|
弹性计算 运维 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生Serverless实践
简介: 通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。
156 1
|
3月前
|
存储 弹性计算 Cloud Native
云原生数据库的演进与应用实践
随着企业业务扩展,传统数据库难以应对高并发与弹性需求。云原生数据库应运而生,具备计算存储分离、弹性伸缩、高可用等核心特性,广泛应用于电商、金融、物联网等场景。阿里云PolarDB、Lindorm等产品已形成完善生态,助力企业高效处理数据。未来,AI驱动、Serverless与多云兼容将推动其进一步发展。
215 8
|
4月前
|
存储 SQL 关系型数据库
MySQL中binlog、redolog与undolog的不同之处解析
每个都扮演回答回溯与错误修正机构角色: BinLog像历史记载员详细记载每件大大小小事件; RedoLog则像紧急救援队伍遇见突發情況追踪最后活动轨迹尽力补救; UndoLog就类似时间机器可倒带历史让一切归位原始样貌同时兼具平行宇宙观察能让多人同时看见各自期望看见历程而互不干扰.
245 9
|
5月前
|
Cloud Native 中间件 调度
云原生信息提取系统:容器化流程与CI/CD集成实践
本文介绍如何通过工程化手段解决数据提取任务中的稳定性与部署难题。结合 Scrapy、Docker、代理中间件与 CI/CD 工具,构建可自动运行、持续迭代的云原生信息提取系统,实现结构化数据采集与标准化交付。
186 1
云原生信息提取系统:容器化流程与CI/CD集成实践

热门文章

最新文章

推荐镜像

更多