数据结构概念
数据是一个抽象的概念,将其进行分类后得到程序设计语言中的基本类型。比如int.float.cahr等。数据元素之间不是独立地,存在特定的关系,这些关系即便是结构。数据结构指数据对象中数据元素之间的关系。
- Python的内置数据结构。Python给我们提供了很多现成的的数据结构类型,这些系统自己定义好的,不需要我们自己去定义的数据结构叫做Python的内置数据结构,比如说列表、元组、字典、元组等。
- Python的拓展数据结构。有些数据组织方式,Python系统里面没有直接的定义,需要我们自己去定义实现这些数据的组织方式,这些数据组织方式称之为Python的扩展数据结构,比如栈,队列。
顺序表概况
在程序中,经常需要将一组(通常是同为某个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等等。一组数据中包含的元素个数可能发生变化(可以增加或删除元素)。
对于这种需求,最简单的解决办法是将这样一组元素看成一个序列,用元素在序列里的位置和顺序,表示实际应用中的某种有意义的信息,或者表示数据之间的某种关系。
这样的一组序列元素的组织形式,我们可以将其抽象为线性表,一个线性表是某类元素的一个集合,还记录着元素之间的一种顺序关系。线性表是最基本的数据结构之一,在实际程序中应用非常广泛,它还经常被用作更复杂的数据结构的实现基础。
根据线性表的实际存储方式,分为两种实现模型:
- 顺序表,将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示。
- 链表,将元素存放在通过连接构造起来的一系列存储块中。
Python里面中的list和tuple两种类型采用了顺序表的实现技术,元组是不可变类型,因此不支持改变其内部状态的任何操作,其他方面元组与列表的性质相似。
顺序表的操作
顺序表的操作
增加
- 在尾端加入元素,时间复杂度是O(1)
- 非保序的加入元素,时间复杂度是O(1) ,有点像交换
- 保序的元素加入,时间复杂的为O(n)
链表意义
顺序表的构建需要预先直到数据大小来申请连续的存储空间,而在扩充时又需要进行数据的搬移,所以在使用起来并不是很灵活,相对的,我们提出链表的概念,链表结构可以充分使用计算机内存空间,实现灵活的内存动态管理。
链表定义
链表(Linked list)是一种常见的基础数据结构,是一种线性表,但是不像顺序表一样连续存储数据,二是在每一个节点(数据存储单元)里存放下一个节点的位置信息(即地址)。
链表与顺序表的对比
链表失去了顺序表随机读取的优点,同时链表由于增加了结点的指针域,空间开销比较大,但对于存储空间的使用更加灵活。
链表与顺序表的各种操作复杂度如下所示:
注意虽然表面上看起来时间复杂度都是O(n),但是链表和顺序表在插入和删除时进行的是完全不同的操作。链表的主要耗时操作是遍历查找,删除和插入的操作本身的复杂度是O(1)。
顺序表查找很快,主要的耗时操作是拷贝覆盖。因为除了目标元素在尾部的特殊情况,顺序表进行插入和删除时需要对操作点之后的所有元素进行前后移位操作,只能通过拷贝和覆盖的方法进行。