【计算机三级数据库技术】第13章 大规模数据库架构--附思维导图

简介: 文章概述了分布式数据库、并行数据库、云计算数据库架构和XML数据库的基本概念、目标、体系结构以及与传统数据库的比较,旨在提供对这些数据库技术的全面理解。

1.png

分布式数据库

.1 基本概念

    分布式数据库是分布式数据库系统中各场地上数据库的逻辑集合

.2 分布式数据库目标与数据分布策略

    目标
        本地自治
        非集中管理
        高可用性
        位置独立性
        数据分片独立性
        数据复制独立性
        分布式查询处理
        分布式事务管理
        硬件独立性
        操作系统独立性
        网络独立性
        数据库管理系统独立性
    数据分布策略
        基本概念
            一般先做数据分片,在做数据分配,数据分片按照一定规则将某一个全局关系划分为片段,数据分配则在此基础上将这些片段分配存储在各个场地上
        数据分片
            水平分片
            垂直分片
            导出分片
            混合分片
        数据分配
            集中式
            分割式
            全复制式
            混合式

.3 分布式数据库系统的体系结构

    参考模型结构
        全局外模式
        全局概念模式
        分片模式
        分配模式
        局部概念模式
        局部内模式
    分布透明性
        分片透明性(最高级别)
        位置透明性
        局部数据模型透明性
    分布式数据库管理系统
        全局数据库管理系统GDBMS(核心)
        全局数据字典GDD
        局部数据库管理系统LDBMS
        通信管理CM

.4 分布式数据库的相关技术

    分布式查询
        查询代价
            集中式数据库
                主要是CPU 代价和IO代价
            分布式数据库
                由于数据分布在多个不同的场地上,使得查询处理中还要考虑站点间传输数据的通信代价
        分布式查询考虑策略
            操作执行的顺序
            操作的执行算法
            不同场地间数据流动的顺序
        注意:在分布式数据库的查询中,导致数据传输量大的主要原因是数据间的连接操作和并操作
    分布式事务管理
        恢复控制
            两阶段提交协议
            三阶段提交协议
        并发控制
            封锁协议

2 并行数据库

2.1 并行数据库系统结构

    共享内存结构
    共享磁盘结构
    无共享结构
    层次结构

2.2 数据划分与并行算法

    数据划分
        基本概念
            是根据关系的某一个属性的值来划分整个关系,这个属性称为划分属性
        一维数据划分
            轮转法
            散列划分
            范围划分
        多维数据划分
            CMD多维划分法
            BERD多维划分法
            MAGIC多维划分法
    并行算法
        并行连接
        并行排序

3 云计算数据库架构

3.1 基本概念

    云计算是一种商业计算模型,它通过集中所有的计算资源,采用硬件虚拟化技术,为云计算使用者提供强大的计算力、存储和带宽资源
    云计算包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施,通常包括软件即服务、平台即服务、基础设施即服务
    云计算的目标是通过网络提供越来越多的服务,实现一切即服务

3.2 体系结构

    BIgTable数据模型
        是Google的云数据库,是一个分布式的结构化数据存储系统,它用于对海量数据进行处理、存储和查询
        特点
            表中的行关键字可以是任意的字符串
            列族是由列关键字组成的集合,是访问控制的基本单位
            时间戳记录了Bigtable中每一个数据项包含的不同版本的数据的时间标识
    BigTable的体系结构
        就像一个巨大的Excel,包含了多个Table,每个Table是一个多维的稀疏表
        使用SSTable作为底层存储数据的格式
        使用了Chubby服务实现锁服务
        BigTable服务器分为一个Master服务器和多个Tablet服务器

3.3 与传统数据库比较

    缺点
        数据安全问题
        对云的管理问题
        对因特网的依赖

4 XML数据库

基本概念
    是一种支持对XML格式文档进行存储和查询等操作的数据库管理系统
三种类型
    XML Enabled Database即能处理XML的数据库
    Native XML Database 纯XML数据库
    Hybrid XML Database混合XML数据库
与传统数据库相比的优势
    XML数据库能够对半结构化数据进行有效的存取和管理
    提供对标签和路径的操作
    当数据本身具有层次特征时,由于XML数据格式能够清晰的表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作
目录
相关文章
|
6月前
|
SQL Java 数据库连接
除了JDBC,还有哪些常见的数据库访问技术?
除了JDBC,还有哪些常见的数据库访问技术?
521 2
|
11月前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
12月前
|
Cloud Native 关系型数据库 分布式数据库
|
存储 关系型数据库 分布式数据库
|
7月前
|
监控 Java 关系型数据库
HikariCP 高性能数据库连接池技术详解与实践指南
本文档全面介绍 HikariCP 高性能数据库连接池的核心概念、架构设计和实践应用。作为目前性能最优异的 Java 数据库连接池实现,HikariCP 以其轻量级、高性能和可靠性著称,已成为 Spring Boot 等主流框架的默认连接池选择。本文将深入探讨其连接管理机制、性能优化策略、监控配置以及与各种框架的集成方式,帮助开发者构建高性能的数据访问层。
738 8
|
7月前
|
监控 Java 关系型数据库
HikariCP 高性能数据库连接池技术详解与实践指南
本文档全面介绍 HikariCP 高性能数据库连接池的核心概念、架构设计和实践应用。作为目前性能最优异的 Java 数据库连接池实现,HikariCP 以其轻量级、高性能和可靠性著称,已成为 Spring Boot 等主流框架的默认连接池选择。本文将深入探讨其连接管理机制、性能优化策略、监控配置以及与各种框架的集成方式,帮助开发者构建高性能的数据访问层。
476 1
|
12月前
|
存储 关系型数据库 分布式数据库
|
7月前
|
SQL 数据管理 BI
数据库操作三基石:DDL、DML、DQL 技术入门指南
本文围绕数据库操作核心语言 DDL、DML、DQL 展开入门讲解。DDL 作为 “结构建筑师”,通过CREATE(建库 / 表)、ALTER(修改表)、DROP(删除)等命令定义数据库结构;DML 作为 “数据管理员”,以INSERT(插入)、UPDATE(更新)、DELETE(删除)操作数据表记录,需搭配WHERE条件避免误操作;DQL 作为 “数据检索师”,通过SELECT结合WHERE、ORDER BY、LIMIT等子句实现数据查询与统计。三者相辅相成,是数据库操作的基础,使用时需注意 DDL 的不可撤销性、DML 的条件约束及 DQL 的效率优化,为数据库学习与实践奠定基础。
|
8月前
|
缓存 关系型数据库 MySQL
MySQL数据库性能调优:实用技术与策略
通过秉持以上的策略实施具体的优化措施,可以确保MySQL数据库的高效稳定运行。务必结合具体情况,动态调整优化策略,才能充分发挥数据库的性能潜力。
309 0
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇

热门文章

最新文章