数据库生态工具&架构|学习笔记(二)

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 快速学习数据库生态工具&架构

开发者学堂课程【关系型数据库 ACP 认证课程数据库生态工具&架构】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/927/detail/14622


数据库生态工具&架构


1) 数据开发能力中周期集成介绍:

image.png数据库的调度任务以小时为单位进行调度,DMS就可以利用它基础的能力。

丰富数据源:

支持27种数据源,包括OLTP/OLAP/NoSQL/对象存储/数据湖;支持跨IDC、云厂商数据源的统一管理。

高性能:

支持分布式集成架构,突破单机瓶颈。同时,提供限流手段,按需先流保护数据源。

运维简单:

通过性能监控、端到端一键诊断功能及报警监控等策略,实现极低运维门槛。

灵活调度

可按需配置调度,最高调度周期可低至5分钟。

1. 数据迁移 DTS

1) 数据迁移DTS产品介绍

数据传输服务(Data Transmission Service,简称DTS)支持关系型数据库、NoSQL、大数据(OLAP)、分布式数据库等数据源,集数据迁移、订阅、实时同步及ETL流式数据处理功能于一体,能够解决公共云、混合云场景下,远距离、秒级异步数据传输难题。其底层基础设施采用阿里双11异地多活架构,为数千下游应用提供实时数据流。

我们的业务方可以自己通过DTS提供的SDK来对接数据进行消费。

image.png2) 整体技术架构介绍:

主要是去消费数据源的一些日志然后去解析成一个中间格式,在针对不同的目标进行转换,最终投递到目标当中。这里面组件很多,比如可以通过控制台、API建立数据传输的任务。会有预检查过程,逐项通过才能往下走。数据的迁移会分成三个阶段:结构迁移、全量迁移和增量迁移。如果是数据订阅,可以通过SDK进行数据实时订阅。

l 全球公有云第一个数据流产品

l 阿里经济体数据库全球化和异地多活底座

l 9年打磨,支撑双11大促

l 支持多达20多种数据源和目标.服务近5万企业客户,已完成近60万个数据库上云

3) 数据实时同步链路原理:

结构迁移、全量迁移、增量迁移三者有机的使用,再结合实时同步就可以实现接近于零停机的迁移。

image.pngl 结构迁移∶迁移元数据。数据类型准确、PK/UK/索引约束准确

l 全量迁移∶迁移存量数据。对数据库影响低、速度快

l 增量拉取∶捕获迁移过程中的变化数据。数据保真、不丢数据

l 增量写入∶迁移增量数据。数据一致、链路无延迟。(幂等、冲突矩阵)

l 全量数据校验︰保障源和目标数据一致性。快速、具备订正能力

4) 多业务场景数据传输解决方案

数据库所在的网络经常是多种多样的,如果这写各种各样的数据库想要迁到云上来。就会面临网络的互通问题。

DTS致力于在公有云、混合云场景下,解决远距离、毫秒级异步数据传输难题,如不停机迁移上云、异地灾备、异地多活、数据中台实时数据集成、数据实时订阅等问题。它底层的数据流基础设施为阿里双11异地多活基础架*为数万下游应用提供实时数据流。用户可以使用数据传输轻松构建安全、可扩展、高可用的数据架构。image.png 

5) 数据实时订阅

主要通过数据订阅支持实时拉取RDS实例的增量日志,用户可以通过DTS提供的SDK数据订阅服务端或者kafka client来订阅增量日志,同时可以根据业务需求,实现数据定制化消费。DTS负责从源库来拉取日志然后进行存储,业务端通过SDK来消费,来实现下游的业务处理。

image.pngDTS服务端的日志拉取模块主要实现从数据源抓取原始数据,通过解析、过滤、标准格式化等流程,最终将增量数据在本地持久化。

日志抓取模块通过数据库协议连接并实时拉取源实例的增量日志。例如源实例为RDS for MySQL,那么数据抓取模块通过Binlog dump协议连接源实例.日志拉取模块及下游消费SDK的高可用:DTS容灾系统一旦检测到日志拉取模块出现异常,就会在健康服务节点上断点重启日志拉取模块,保证日志拉取模块的高可用。

DTS支持在服务端实现下游SDK消费进程和client的高可用。用户同时对一个数据订阅链路,启动多个下游SDK消费进程和消费client ,服务端同时只向下游消费推送增量数据,当这个消费进程异常后,服务端会从其他健康下游中选择一个消费进程,向这个消费进程推送数据,从而实现下游消费的高可用。

6) 业务数据实时分析与计算

场景说明∶用户需要实时或定期对线上业务数据进行数据分析,以实现营销决策,业务大屏,实时查询等业务场景

解决方案∶使用数据同步功能,将线上业务变更数据准实时同步到大数据分析产品中,业务实现准实时数据分析,快速抢占商务先机。

实时分析:

业务更新数据需要同步到AnalyticDB/Maxcompute中,跟其他数据进行实时交叉查询分析。

流式分析:

流式分析需要借助流计算对线上业务更新数据进行流式分析。

2. 数据备份服务 DBS

1) 数据备份服务DBS的产品介绍

● 数据备份(简称DBS)是阿里云提供的低成本、高可靠的云原生数据备份平台。DBS旨在保护数据资产、激活数据价值。

● DBS提供无限容量的备份存储、秒级应急恢复和恢复演练,并借助秒级沙箱实例和备份数据查询激活冷数据。DBS支持MySQL、SQL Server、Oracle等近10种数据库,支持文件、日志、数据库等全站备份,支持本地数据中心、其他云厂商、ECS数据库及RDS数据库等环境,是客户首选的企业级混合云统一备份平台。

● DBS旨在保护数据资产、激活数据价值。

image.png2) 数据备份服务DBS的产品介绍-数据副本管理(CDM)

通过CDM可以把来自于阿里云或者其他云提供的数据源,都可以同步到DBS中。

image.pngDBS服务端大体架构分为三层。中间层为混合云备份管理,包括备份策略、数据源、存储管理、备份数据、应急容灾、恢复演练、对比校验、监控告警。中间层之上是云原生数据应用,包括开发测试、历史归档、数据湖分析、云容灾。最下面是混合云存储管理。

3) 数据备份服务DBS支持的数据源及其环境

数据源:

①数据库︰

● OLTP : MySQL、Oracle、sQL Server、PostgresQL、PolarDB MySQL、PolarDB PostgresQL、PolarDB O、PolarDB-X

● OLAP :ADB PG,ADB MySQL

● NoSQL : Redis、MongoDB

②文件︰文件、审计日志

环境:

①阿里云∶阿里云数据库、阿里云ECS自建数据库和文件

②混合云∶本地IDC自建数据库和文件

③其他云∶AWS、华为云、腾讯云、京东云、UCloud等自建数据库和文件

4) 数据备份服务DBS支持的存储类型

云存储:

①分布式快照存储:CDM

②分布式对象存储:OSS/S3

③分布式文件系统∶

● Lindorm/HDFS

● NAS ( NFS/SMB )

归档存储:

①归档型OSS

②阿里云ECS/本地IDC:Linux/Windows服务器自动/手动

③本地IDC :

● NAS、FTP、Minio ( S3 )

● 蓝光、光盘

5) 数据备份服务DBS支持的备份方式

①数据:

物理备份,包括全量、增量、日志

逻辑备份,包括全量、日志

快照备份,包括全量、日志

②上传:流式备份、转储备份、挂载备份

③加速:置并发数提升备份恢复速度

④限流:置IO限流值或带宽限流值

⑤安全:

配置HTTPS传输加密

配置AES256和BYOK存储加密

⑥降本:

配置GZIP、LZ4、引擎内置压缩算法

部分版本可配置源端、异步重删

⑦网络:公网、专线、cen、数据库网关DG(无需暴露公网)接入

⑧计算:配置SQL进行历史数据归档

⑨存储:配置多级存储池进行多级数据流转和管理

6) 数据备份服务DBS支持的恢复方式

①恢复粒度:例、库、表恢复

②恢复环境:可挂载CDM存储盘恢复到原实例、自建新实例、RDS新实例、CDM沙箱新实例

③恢复新实例规格:按需创建指定规格

④可恢复时间点:物理、逻辑、快照备份的全量可恢复当前全量时间点,增量备份可恢复当前增量时间点,日志备份可恢复任意时间点

⑤恢复演练:定时恢复到RDS、CDM秒级恢复演练,数据可用性校验,演练和可用性报告。

7) 数据备份服务DBS支持的备份数据应用方式

①SQL查询备份:CDM沙箱实例可查询任意时刻数据状态,DLA可查询全量备份数据状态

②下载出云:配置手工、自动下载出云

③下载计算:全量备份转CSV、打包计算

8) 数据备份服务DBS的典型应用场景

①统一备份∶云数据库/自建库、维护/巡检/策略/账号/优化

②库表恢复∶仅单库或单表恢复到源实例

③应急恢复∶全增合并(后台)、快照挂载(秒级)、日志应用(任意时间点)、1TB/2分钟(数据恢复)、512MB/5分钟(日志恢复)

④恢复演练∶备份数据自动做恢复验证并产出演练报告

⑤数据构建︰备份数据应用,用于开发/测试/压测/报表/分析跨地域⑥跨地域备份︰跨境、跨云、跨可用区

⑦数据归档∶释放前保留、行级数据保留并清理(DMS)

⑧备份到本地∶备份到客户存储,NAS/S3等

⑨备份上云∶冷备到阿里云,同地或异地

⑩灾备上云∶冷备到阿里云,云端快速拉起


二、 回顾与总结

image.png阿里云的数据库生态工具分别是:

数据库自治服务DAS:数据库常见问题和解决方案,自治数据库发展趋势与核心技术,数据库自治服务功能与技术解析。

数据管理DMS:数据管理DMS功能简介。

数据传输服务DTS:数据迁移DTS功能简介。

数据库备份DBS:数据备份DBS功能简介。

 

三、 试题

1、数据库自治服务DAS是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务。以下属于DAS主要功能的是()

A、SQL诊断和优化

B、慢SQL分析

C、增量SQL分析

D、全量SQL分析

E、快SQL分析

DAS主要功能的是SQL诊断和优化、慢SQL分析、全量SQL分析,快SQL分析,是没有这种说法的。

2、数据库备份DBS是阿里云提供的低成本、高可靠的云原生数据库备份平台。DBS通过备份网关连接服务器,进行备份、恢复及下载数据等操作。以下()需要用户安装DBS备份网关。

A、RDS数据库物理备份

B、自建MySQL数据库物理备份

C、自建SQL Server数据库物理备份

D、RDS数据库逻辑备份

如果是阿里云自己的数据库里面,就不需要去安装备份的网关,阿里云自己就打通了。只有在自建的数据库上才需要去安装备份的网关。

3、备份集的生命周期为备份数据在数据库备份DBS中的保存周期。用户可以配置备份集生命周期,DBS会根据自定义的规则来自动进行备份集转存与过期清理。下列关于备份集的生命周期说法正确的是()。

A、在创建备份计划后修改了生命周期,修改后的新配置规则对新生成备份集和已存在备份集都生效

B、在创建备份计划后修改了生命周期,修改后的新配置规则仅对新生成备份集生效,对已存在备份集都不生效

C、DBS根据生命周期清理过期备份集的条件为该备份计划的全量备份集大于3个

D、只有全量数据备份设置生命周期,增量备份不支持设置生命周期

在创建备份计划后修改了生命周期,修改后的新配置规则对新生成备份集和已存在备份集都生效的。过期清理的规则是,为这个备份计划的群量备份集如果大于3个就会产生过期清理操作。没有达到就不会触发过期清理。D错在全量增量都支持设置生命周期的。

4、某用户将PolarDB历史库作为阿里云RDS MySQL或者PolarDB MySQL引擎数据库服务的归档存储地,将访问较少的历史数据迁移到PolarDB MySQL引擎X-Engine中存储,释放在线数据库的空间以降低成本并提升性能,那么该用户可以通过()将在线数据迁移至PolarDB历史库。

A、DAS

B、DTS

C、DMS

D、DBS

可以通过DMS周期性的把在线的数据给导入带PolarDB历史库当中。

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
11月前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
10月前
|
存储 关系型数据库 数据库
高性能云盘:一文解析RDS数据库存储架构升级
性能、成本、弹性,是客户实际使用数据库过程中关注的三个重要方面。RDS业界率先推出的高性能云盘(原通用云盘),是PaaS层和IaaS层的深度融合的技术最佳实践,通过使用不同的存储介质,为客户提供同时满足低成本、低延迟、高持久性的体验。
|
10月前
|
存储 人工智能 前端开发
Google揭秘Agent架构三大核心:工具、模型与编排层实战指南
本文为Google发布的Agent白皮书全文翻译。本文揭示了智能体如何突破传统AI边界,通过模型、工具与编排层的三位一体架构,实现自主推理与现实交互。它不仅详解了ReAct、思维树等认知框架的运作逻辑,更通过航班预订、旅行规划等案例,展示了智能体如何调用Extensions、Functions和Data Stores,将抽象指令转化为真实世界操作。文中提出的“智能体链式组合”概念,预示了未来多智能体协作解决复杂问题的革命性潜力——这不仅是技术升级,更是AI赋能产业的范式颠覆。
2881 1
|
11月前
|
存储 Cloud Native 关系型数据库
PolarDB开源:云原生数据库的架构革命
本文围绕开源核心价值、社区运营实践和技术演进路线展开。首先解读存算分离架构的三大突破,包括基于RDMA的分布式存储、计算节点扩展及存储池扩容机制,并强调与MySQL的高兼容性。其次分享阿里巴巴开源治理模式,涵盖技术决策、版本发布和贡献者成长体系,同时展示企业应用案例。最后展望技术路线图,如3.0版本的多写多读架构、智能调优引擎等特性,以及开发者生态建设举措,推荐使用PolarDB-Operator实现高效部署。
501 4
|
12月前
|
负载均衡 算法 关系型数据库
大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL集群架构负载均衡故障排除与解决方案
本文深入探讨 MySQL 集群架构负载均衡的常见故障及排除方法。涵盖请求分配不均、节点无法响应、负载均衡器故障等现象,介绍多种负载均衡算法及故障排除步骤,包括检查负载均衡器状态、调整算法、诊断修复节点故障等。还阐述了预防措施与确保系统稳定性的方法,如定期监控维护、备份恢复策略、团队协作与知识管理等。为确保 MySQL 数据库系统高可用性提供全面指导。
|
11月前
|
人工智能 监控 前端开发
基于 Next.js 的书法字体生成工具架构设计与 SSR 优化实践
本项目是一款书法字体生成工具,采用 Next.js 14(App Router)与 Tailwind CSS 构建前端,阿里云 Serverless 部署后端。通过混合渲染策略(SSG/SSR/CSR)、Web Worker 异步计算及 CDN 字体分片加载优化性能。服务端借助阿里云函数计算处理计算密集型任务,将平均耗时从 1200ms 降至 280ms,支持 1000+ QPS。动态路由与 ARMS 监控提升工程化水平,未来计划引入 WebGPU 和 AI 字体风格迁移技术,进一步优化用户体验。
|
存储 SQL 并行计算
【赵渝强老师】达梦数据库MPP集群的架构
达梦数据库提供大规模并行处理(MPP)架构,以低成本实现高性能并行计算,满足海量数据存储和复杂查询需求。DM MPP采用完全对等无共享体系,消除主节点瓶颈,通过多节点并行执行提升性能。其执行流程包括主EP生成计划、分发任务、各EP并行处理及结果汇总返回。为确保高可用性,建议结合数据守护部署。
494 0
|
7月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
484 158
|
7月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
7月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
1190 152