数据库杂谈(四)—— 关系演算和E-R数据模型

简介: 本文讲述了关系演算和E-R数据模型的相关内容

3 形式化关系查询语言

3.2 关系演算和E-R数据模型

3.2.1 概述

除了用关系代数表示关系操作外,还可以用谓词演算来表达关系的操作,这称为关系演算

关系代数表示关系的操作,须标明关系操作的次序,哪个操作先哪个后你要说清楚,所以以关系代数为基础的数据库语言是过程化查询语言。用关系演算表示关系的操作,只要说明所要得到关系的结果,而不必标明操作的过程,因而他是非过程的。关系演算分为元组关系演算域关系演算

3.2.2 元组关系演算

3.2.2.1 概述

元组关系演算就是以元组为变量,一般形式是${t[<属性表>]|P(t)}$。

一般形式描述了其为使谓词P为真的元组t的集合。当我们选的不是元组,而是元组的部分属性的时候,就可以采用属性表。

利用关系演算是可以做关系代数的所有操作的。举一个例子,如果我们要查询江苏籍贯的女大学生姓名,那么我们会这么写:

$$ {t[姓名]|t∈STUDENT AND t.性别 = '女' and t.籍贯 = '江苏'} $$

但是对于上面的查询,我们只是表达了要查找的元组是在所表达的条件之中。为了表达要查询的请求,我们需要引入数理逻辑的“存在”这一结构。记法为:$\exist t∈r(Q(t))$。这样的意思是表示关系r中存在元组t使谓词Q(t)为真。并且,我们在考试中很少写and和or,而是改用$\bigwedge和\bigvee$来代替。

用上面的表达来表示上面的例子,即为:${t[姓名]|\exist t∈STUDENT \bigwedge t.性别 = '女' \bigwedge t.籍贯 = '江苏'}$。

那如果我们想表示学生表里不是江苏籍贯的女大学生的姓名呢?这只需要用 $\urcorner$,即否定符号,如下:${t[姓名]|¬ \exist t∈STUDENT \bigwedge t.性别 = '女' \bigwedge t.籍贯 = '江苏'}$

如果我们要表达那些是江苏所有的大学生呢?我们会发现,这里面含有一个所有的概念,为了用元组关系演算书写此查询,我们引入了$\forall$。

在上面的叙述中我们发现,我们基本都是把高中课本上面的谓词全部搬上来关系演算使用。

3.2.2.2 形式化定义

结果上一小节的叙述,我们知道元组关系演算表达式具有如下形式:${t | P(t)}$。其中P是一个公式,公式中可以出现多个元组变量。对于没有被量词绑定的变量,我们称为自由变量。如果被量词绑定了,我们称为受限变量

对于元组关系演算的公式,其由原子组成,原子可以是如下的形式之一:

  • 如果是s∈r,那么代表s是元组变量r是关系。这是需要注意的是我们不允许使用$∉$。
  • 对于s[x]op[y],那么其中op为<,>,=,<=,>=,!=当中任意一个。

3.2.2.3 表达式的安全性

元组关系演算与关系代数具有同等表达能力,也是关系完备的。用谓词演算表示关系操作时,只有结果是有限集才有意义。也就是说,一个表达式的结果如果是有限的,我们叫做表达式是安全的。反之,我们说他是不安全的。例如$\{t| t ¬ ∈STUDENT\}$,宇宙中不属于学生的东西是无限的,这个表达式是不安全的

3.2.3 域关系演算

关系演算的另一种形式为域关系演算,使用从属性域中取值的域变量,而不使用一整个元组的值。

就是关系代数是SQL语言的基础一样,域关系演算是被广泛采用的QBE语言。

域关系演算一般以域为变量,其一般形式为:${<x1,x2,…,xn>|P(x1,x2,…x(n+m))}$。

这样说我们可能有点费解。在下面,我们有完整的习题可供练习。

域关系演算也是完备的,实际上这个案例和选择操作很像。

3.2.4 关于关系演算的习题

对于1、3、5写出元组关系演算,对于2、4、6写出域关系演算。

image-20220130150227058

image-20220130150818174

image-20220202231246548

这里留给各位看官一个BUG,第5题由于我的技术可能写的不对,网上的答案也是错的。所以如果是错的可以给我来个答案,如果是对的给我个提醒哈哈。

3.2.5 对传统数据模型的评价

一般来说,我们把层次,网状和关系数据模型称为传统数据模型。对于传统数据模型来说有四个弱点:

  • 以记录为基础,不能很好地面向用户和应用

    比如衣服,有一个衣服的表,里面有个属性是衣服的袖口类型,但是在现实世界中有很多连袖口都没有的衣服,虽然有NULL可以作为填补,但是用NULL是迫不得已,并不是一种自然的表示。
  • 不能以自然的方式表示实体之间的联系。

    有些联系本来不是那种PCR关系,不是链表关系,但是我们还是要引入什么link,什么虚记录来表示这些关系,这些表示是很不自然的。
  • 语义贫乏。

    比如你定义了一个表,表里面有学生的性别、年龄、身高、体重,但是你却不知道他们本身代表什么意思,我可以说这是学生的医疗记录,也可以说这是入学信息报告。还有表与表直接的联系,由于没有标明联系,有时候用户还需要查帮助文档和一些文件才能了解。所以,由于语义不明,导致就算语义理解错了也要用户自己负责。
  • 数据类型太少,难以满足应用需要。

3.2.6 E-R数据模型

3.2.6.1 基本概念

E-R数据模型,也叫实体联系数据模型。其提出的目的如下:

  1. 企图建立一个统一的数据模型,以概括三种传统的数据模型;
  2. 作为三种传统数据模型互相转换的中间概念
  3. 作为超脱DBMS的一种概念数据模型,以比较自然的方式模拟现实世界。

在E-R数据模型中有三个概念我们需要先知道,分别是实体属性联系

实体

  • 概念:凡是可以被人互相区别的东西就叫实体。
  • 范例:飞机,春游,神,梦。
  • 注意:同类实体我们可以归为一类,称为实体集
  • 范例:用E代表学生的实体集,那么E = {e|e是学生}

属性

  • 概念:实体的特征叫实体的属性,属性取值的范围叫值集。值集的说法相当于关系数据模型里的属性域。

联系

  • 概念:实体之间(也包括和实体集)的各种关系我们称之为联系。
  • 范例:某个学生(实体)和课程(实体)之间有选课关系。学生(实体集)和课程之间的选课关系。人与人直接有领导关系,夫妻关系。
  • 表示方法:如果实体e1,实体e2之间有联系,我们用<e1,e2>来表示,扩展到n个实体,我们用<e1,e2…,en>来表示,当n>2的时候,我们称为多元联系。

联系集

概念:比如说夫妻是一种联系,那么具体的比如:<e1,e2>两个人就是这个联系的实例,生活中是夫妻的不止一对,所以多个实例我们用集合包括起来,称为联系集。

有时为了表明实体在联系中的作用,我们会这么表示,以夫妻为例:

$$ <r1/e1,r2/e2,…,rn/en> $$

其中r表示哪个是夫,哪个是妻。

说明:联系虽然用元组表示,但实体间的次序不是重要的,尤其标明作用后,他们的次序可以任意。

3.2.6.2 E-R图

用E-R数据模型对一个单位的模拟,称为一个单位的E-R数据模式。E-R数据模式可以用非常直观地E-R图来表示。

image-20211002153926103

其中矩形框代表实体,菱形代表联系,椭圆代表属性。

需要注意的是,上述的表示实际上是不完整的,但是在大学考试以及考研中只要求用上述表述即可。

其他表示:

  • 未分割的矩形代表联系集的属性
  • 虚线将联系集属性连接到联系集
  • 双线显示实体在联系集中的参与度
  • 双菱形表示弱实体集

image-20220203115430184

对于E-R图来说有两个约束:基数比约束参与度约束。它们两个合称联系约束

基数比约束

比如联系有1:1,1:N,N:1,M:N。我们把这个数量上实体间的约束称为基数比约束。基数比约束在数据库原书上也被称为映射基数

范例:一个员工只能在一个工作部门工作,这就是1:1。

参与度约束

比如这个银行卡账号你最多只能取钱5次,比如这门课最多容纳学生150人,这就是参与度约束。

表达方式:(min,max)

3.2.7 题型总结

3.2.7.1 如何画E-R图

步骤总结:

  1. 找出实体并用矩形表示
  2. 找出实体的属性用椭圆表示
  3. 找出实体间的关系,用菱形表示

image-20211230212433335

image-20211230220040718

<br/>

3.2.7.2 E-R图转关系模式

步骤总结:

  1. 实体转换为一个关系模式
  2. 实体的属性就是关系的属性,实体的码就是关系的码
  3. 实体间联系的转换

    • 1:1联系:在任意一方加入对方的主码变为外码,并加入联系本身的属性。
    • 1:n联系:将1方的主键加入n方作为其外键,并同时将联系的属性也加入n方。
    • m:n联系:将联系本身本身转化为一个关系模式,联系双方的主码加入其中,并将联系的属性加入其中。

image-20211230212450984

image-20220202231534255

3.2.8 扩充E-R数据模型

扩充E-R数据模型我们通常称为EER,在EER引入以下的几个概念:弱实体、特殊化和普遍化、聚集、范畴。

弱实体(Weak entity)

弱实体实际上可以当成实体,可以当成属性,由数据库库设计者决定。

范例:比如一个职工,他的家属实体集可能有姓名,出生日期,和职工的关系这些属性,但是家属的姓名是可以重复的。什么意思呢,简而言之就是家属实体集中的表没有键(没有实体键),导致失去了辨认家属的能力了,所以一般来说弱实体可以不做实体,只当做拥有这个实体集的那个实体(所有者实体)的组合属性。

特殊化和普遍化(Specialization and Generalization)

范例:从普遍到特殊叫特殊化,在一些书上也叫做特化;如学生是普遍,划分为研究生高中生本科生是特殊,研究生还可以继续划分为学术型研究生和专业性研究生。反之叫普遍化,在一些书上叫做概化

聚集(Aggregation)

就是把实体集和联系看成新的一个实体集,新的实体集中的属性是原来实体集的属性和联系的属性的并。

image-20211007134053250

范畴(Category)

在模拟现实世界时,有时候要用到不同类型的实体组成的实体集。我们把这类实体集叫做范畴。

  • 范例:车主有可能是一个人,有可能是一个企业的单位。
  • 表达方式:T(E1,E2,E3,…,En)
  • 说明:其中里面的不同的实体集我们叫做超实体集,例如E1是超实体集。
  • 图例:圆圈∪代表并操作。

image-20211007134142274

这里有一点需要说明一下,我们前面说过特殊化,特殊化也就是一个子类对于父类的继承,并且继承了所有的属性,但是范畴不一样。拿这个例子来说,单位和人构成范畴,但是这个账户不是说既是单位又是人的,他的继承具有选择性,如果账户是单位的,则继承单位的属性,是个人的继承个人的属性,这叫选择性继承

目录
相关文章
|
8月前
|
存储 机器学习/深度学习 搜索推荐
深入解析矢量数据库的数据模型与索引机制
【4月更文挑战第30天】本文深入探讨了矢量数据库的数据模型和索引机制。向量数据库以高维向量表示数据,采用稀疏或密集向量形式,并通过数据编码和组织优化存储与检索。索引机制包括基于树的(如KD-Tree和Ball Tree)、基于哈希的(LSH)和近似方法(PQ),加速相似性搜索。理解这些原理有助于利用矢量数据库处理大规模高维数据,应用于推荐系统、图像搜索等领域。随着技术发展,矢量数据库将扮演更重要角色。
|
4月前
|
前端开发 数据库 开发者
数据模型(数据库表设计)生成代码
BizWorks ToolKit 插件集成 Mybatis-Plus 代码生成工具,支持从数据库表批量生成代码,简化开发流程。本文详细介绍配置方法及项目示例,包括配置文件格式、生成选项及具体操作步骤,帮助开发者快速实现代码同步更新。配置文件 `.mp.yaml` 支持自定义输出目录、生成组件等,适用于多种项目结构。
64 0
|
5月前
|
API 数据库 开发者
【独家揭秘】Django ORM高手秘籍:如何玩转数据模型与数据库交互的艺术?
【8月更文挑战第31天】本文通过具体示例详细介绍了Django ORM的使用方法,包括数据模型设计与数据库操作的最佳实践。从创建应用和定义模型开始,逐步演示了查询、创建、更新和删除数据的全过程,并展示了关联查询与过滤的技巧,帮助开发者更高效地利用Django ORM构建和维护Web应用。通过这些基础概念和实践技巧,读者可以更好地掌握Django ORM,提升开发效率。
59 0
|
7月前
|
SQL 关系型数据库 MySQL
MySQL数据库数据模型概念入门及基础的SQL语句2024
MySQL数据库数据模型概念入门及基础的SQL语句2024
47 0
|
7月前
|
存储 监控 数据管理
数据库原理与应用——简答题练习(数据管理技术发展、数据库主要特征、数据模型、关系模型、实体性之间的关系、DBMS的功能、相关术语解释、数据库系统)
数据库原理与应用——简答题练习(数据管理技术发展、数据库主要特征、数据模型、关系模型、实体性之间的关系、DBMS的功能、相关术语解释、数据库系统)
97 0
|
7月前
|
SQL 关系型数据库 MySQL
MySQL数据库——概述-MySQL的安装、启动与停止和客户端连接、关系型数据库(RDBMS)、数据模型
MySQL数据库——概述-MySQL的安装、启动与停止和客户端连接、关系型数据库(RDBMS)、数据模型
73 0
|
8月前
|
存储 SQL 数据挖掘
数据模型概述与数据库基础
数据模型是描述现实世界数据对象结构的形式化、真实和易理解的表示。分为概念模型(信息模型)和数据模型,前者面向用户,后者关注计算机实现。数据库是结构化、共享、低冗余的数据集合,提供数据独立性。数据库管理系统(DBMS)负责数据的存储、访问和管理,而数据库系统(DBS)包括数据库、DBMS、应用系统、DBA和用户。数据库系统开发涉及需求分析、系统设计(概念设计、逻辑设计、物理设计)、系统实现和运行维护(数据更新、备份、分析等)。
72 0
|
8月前
|
SQL 关系型数据库 MySQL
【MySQL-1】理解关系型数据库&数据的数据模型
【MySQL-1】理解关系型数据库&数据的数据模型
|
存储 分布式计算 NoSQL
分布式数据库HBase的基本概念和架构之基本数据模型的Cell
HBase是一个分布式数据库系统,基于Google的Bigtable和Apache Hadoop的HDFS构建而成。它是一个分布式数据库的NoSQL数据库,主要用于存储和处理海量数据。HBase的核心特性包括高可用性、高性能和高伸缩性。在阿里云开发者社区中,我们将介绍HBase的基本概念和架构,以及它的基本数据模型Cell。
735 0
|
存储 分布式计算 NoSQL
分布式数据库HBase的基本概念和架构之基本数据模型的Row
HBase是一个分布式数据库系统,基于Google的Bigtable和Apache Hadoop的HDFS构建而成。
293 0

热门文章

最新文章