概述
数据模型也是一种模型,是对现实世界数据特征的抽象。
也就是说,数据模型用来描述数据、组织数据和对数据进行操作的。
数据模型应该满足三方面要求:
- 能比较真实的模拟现实世界
- 容易理解
- 便于在计算机上实现
一、两类数据模型
1.概念模型
也称信息模型,是按照用户的观点对数据和信息建模,主要用于数据库设计。
2.逻辑模型和物理模型
1)逻辑模型
主要包括网状模型、层次模型、关系模型、面向对象模型等,按计算机系统的观点对数据建模,用于DBMS实现
2)物理模型
是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法
3.两种数据模型之间的关系
- 首先人们将现实世界抽象转化为信息世界,即概念模型,此过程由数据库设计人员完成。
- 为了更好的组织数据,要将信息世界转化为机器世界,即从概念模型抽象为逻辑模型,选择恰当的数据展示形式。
- 随后从逻辑模型转化为物理模型,此过程通常由DBMS完成。
二、数据模型的组成要素
1.数据结构
描述数据库组成对象以及对象之间的联系,是对系统静态特性的描述。
分类:
- 与对象的类型、内容、性质有关的。
例如:网状模型中的数据项、记录,关系模型中的域、属性、关系等 - 域数据之间联系有关的对象
例如:网状模型中的系型
2.数据操作
是对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则,是对系统动态特性的描述。
3.数据的完整性约束条件
是一组完整性规则的集合,即给定的数据模型中数据及其联系所具有的制约和储存规则。任何关系必须满足实体完整性和参照完整性两个条件
三、概念模型
一方面应该具有较强的语义表达能力,另一方面还应该简单清晰‘易于理解。
1.信息世界中的基本概念
- 实体:客观存在并可相互区别的事物
- 属性:表中的一列即为一个属性,给每一个属性起一个名称即属性名
- 码:唯一确定一个元组的属性或属性组
- 域:是一组具有相同数据类型的值的集合
- 分量:元组中的一个属性值
- 实体型:具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型
- 实体集:同一类实体的集合称为实体集
2.两个实体之间的联系
- 一对一联系(1:1)
- 一对多联系(1:n)
- 多对多关系(m:n)
四、最常用的数据模型
1.层次模型
- 层次模型将数据组织成一对多关系的结构,层次结构采用关键字来访问其中每一层次的每一部分。
- 层次模型发展最早,它以树结构为基本结构,典型代表是IMS模型。
- 优点是存取方便且速度快;结构清晰,容易理解;数据修改和数据库扩展容易实现;检索关键属性十分方便。
2.网状模型
- 网状模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式。
- 网状数据模型通过网状结构表示数据间联系,开发较早且有一定优点,目前使用仍较多,典型代表是 DBTG模型。
- 优点是能明确而方便地表示数据间的复杂关系。
3.关系模型
关系模型是最重要的一种数据模型。关系数据库系统采用关系模型作为数据的组织方式。
关系模型的数据操纵与完整性约束
- 关系模型的数据操纵:查询、插入、删除和更新数据。这些操作必须满足关系的完整性约束条件。
- 关系模型的完整性约束:完整性、参照完整性和用户定义的完整性。
关系模型的优缺点
优点:
- 关系模型与格式化模型不同,它是建立在严格的数学概念的基础上的
- 关系模型的概念单一。无论实体还是实体之间的联系都用关系来表示。对数据的检索和更新结构也是关系。所以其数据结构简单、清晰、用户易懂易用
- 关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作
缺点:
- 由于存取路径对用户数隐蔽的,所以查询效率不如格式化数据模型。