一 、见见STL中的list
1、list的介绍
下面我们了看看cpulcpul官网中的介绍:
文档介绍:
- list是可以在常数范围内在任意位置进行插入和删除的序列式容器,并且该容器可以前后双向迭代。
- list的底层是双向链表结构,双向链表中每个元素存储在互不相关的独立节点中,在节点中通过指针指向 其前一个元素和后一个元素。
- list与forward_list非常相似:最主要的不同在于forward_list是单链表,只能朝前迭代,已让其更简单高效。
- 与其他的序列式容器相比(array,vector,deque),list通常在任意位置进行插入、移除元素的执行效率更好。
- 与其他序列式容器相比,list和forward_list最大的缺陷是不支持任意位置的随机访问,比如:要访问list 的第6个元素,必须从已知的位置(比如头部或者尾部)迭代到该位置,在这段位置上迭代需要线性的时间 开销;list还需要一些额外的空间,以保存每个节点的相关联信息(对于存储类型较小元素的大list来说这 可能是一个重要的因素)。
从上面的介绍中我们初步认识到了list的是带头双向链表,对于要掌握的数据结构之一,下面我们一起来回忆一下他的增删查改操作。
2、list的常见接口
list的有很多接口,下面我们主要介绍几个重点接口:
list的构造
因为list在C++中是用类来封装的,他也就有自己的构造函数,但由于list初始化的场景非常多,所以他有多个构造函数,下面的在模拟实现的时候可以细细体会,下面我们先见见有哪些构造函数:
构造函数(Construct) |
接口说明 |
list (size_type n, const value_type& val = value_type()) |
构造的list中包含n个值为val的元素 |
list() |
构造空的list |
list (const list& x) |
拷贝构造函数 |
list (InputIterator first, InputIterator last) |
用[first, last)区间中的元素构造list |
list modifiers
为来对list进行修改,也提供了一些修改的接口:
函数声明 |
接口说明 |
push_front |
在list首元素前插入值为val的元素 |
pop_front |
删除list中第一个元素 |
push_back |
在list尾部插入值为val的元素 |
pop_back |
删除list中最后一个元素 |
insert |
在list position 位置中插入值为val的元素 |
erase |
删除list position位置的元素 |
swap |
交换两个list中的元素 |
clear |
清空list中的有效元素 |
显示详细信息
二、list的模拟实现
为了更好的理解list的底层实现,下面将大家一起去模拟实现list。
1、list框架搭建
我们要模式实现list,而list是个带头双向链表,那么我们首先搭建一个list_node的类模板
struct list_node { list_node<T>* _next;//指向后一个节点 list_node<T>* _prev;//指向前一个节点 T _data;//节点中的数据 list_node(const T& x) :_next(nullptr) , _prev(nullptr) , _data(x) {} };
这里我们要注意的是我们不仅仅定义了节点的指向,我们还应该对节点进行初始化。
有了节点,那么我们就应该定义list类的主体,他的私有变量应该要有指向list_node的指针head,和记录链表个数的size,为了方便定义,这里我们可以直接对list_node的变量名重定义。
template<class T> class list { typedef list_node<T> node; public: //各种成员函数 private: node* _head; size_t _size; };
下面我们就要实现各种成员函数就可以了,但是在实现成员函数之前,我们要先实现list的迭代器。
2、模拟实现list迭代器
我们在模式实现vector的迭代器的时候,认为迭代器就是一个指针。那么我们这里也可以把list的迭代器当作指针实现吗?这里显然是不可以的,为什么这么说呢?
当一个指针++他跳过的是他的一个类型的大小,但是list节点并不是挨个存储的他节点的空间是随机的,节点间是依靠节点中存放对方的地址指向对方的。
其实不仅仅++操作不满足,还有许多操作都是不满足的,如--操作。
我们又该如何解决这个问题呢?
其实我们可以用一个类模板,包含迭代器功能的成员函数,就可以解决。当我们调用迭代器时其实就是调用类模板中的成员函数。
但是这里要注意一个细节:由于成员函数他的返回值可能存在类型的差异,比如:*解引用的时候,返回_pnode->_data,但是->的时候是&_pode->_data;
这样类模板的参数就不仅仅是一个模板参数,而要三个模板参数才能解决。
//定义迭代器 template <class T,class Ref,class Ptr> struct __list_iterator { typedef list_node<T> node; typedef __list_iterator<T, Ref, Ptr> Self; node* _pnode; //初始化 __list_iterator(node* p) :_pnode(p) {} Ptr operator->() { return &_pnode->_data; } Ref operator*() { return _pnode->_data; } Self& operator++() { _pnode = _pnode->_next; return *this; } Self operator++(int) { Self tmp(*this); _pnode = _pnode->_next; return tmp; } Self& operator--() { _pnode = _pnode->prev; return *this; } Self operator--(int) { Self tmp(*this); _pnode = _pnode->_prev; return tmp; } bool operator!=(const Self it)const { return _pnode != it._pnode; } bool operator==(const Self& it)const { return _pnode == it._pnode; } };
其实不少同学可能会困惑,为什么要在迭代器中重载出->,这个不是我们在用结构体或者类中指针成员才用到的吗?
我们要明白list节点中可能存放的不是数据,也可能是存放指针一个结构体的指针。
下面我们来看代码理解:
struct Pos { int _row; int _col; Pos(int row = 0, int col = 0) :_row(row) , _col(col) {} }; void print_list(const list<Pos>& lt) { list<Pos>::const_iterator it = lt.begin(); while (it != lt.end()) { //it->_row++; cout << it->_row << ":" << it->_col << endl; ++it; } cout << endl; } void test3() { list<Pos> lt; Pos p1(1, 1); lt.push_back(p1); lt.push_back(p1); lt.push_back(p1); lt.push_back(Pos(2, 2)); lt.push_back(Pos(3, 3)); // int* p -> *p // Pos* p -> p-> list<Pos>::iterator it = lt.begin(); //list<Pos>::iterator it2 = it; while (it != lt.end()) { it->_row++; //cout << (&(*it))->_row << ":" << (*it)._col << endl; cout << it->_row << ":" << it->_col << endl; //cout << it.operator->()->_row << ":" << it->_col << endl; ++it; } cout << endl; print_list(lt); }
这里我们定义了一个Pos的类,他的功能就是记录row 和col,在定义一个函数print_list打印list中的做标,下面在我们的测试函数在插入一些数据。如果是在测试函数体内打印lt本来是非常复杂的如果没有重载迭代器的->.
这里理解: (&(*it))->_row?----->简单的来是就是要拿到这个it节点中的数据
如果我们要拿到Pos中的数据就只要用Pos创建一个变量p,p->row,就能拿到类中的数据,但是现在我们只有一个指向链表节点的迭代器,也就是只要我们*解引用it就能拿到节点中的数据,但是节点中的数据是一个类的,要能到类Pos的数据就要拿到类的地址,并用->指向结构体中变量的数据。
听起来是不是好晕,所以为了简化操作我们就在迭代器的类中封装了->.
Ptr operator->() { return &_pnode->_data;//&这里是取地址,也就是说返回的指针 }
迭代器失效问题
我们都知道迭代器是用类封装好的里面有功能各异的成员函数,迭代器失效即迭代器所指向的节点的无效,即该节点被删除了。因为list的底层结构为带头结点的双向循环链表,因此在list中进行插入时是不会导致list的迭代 器失效的,只有在删除时才会失效,并且失效的只是指向被删除节点的迭代器,其他迭代器不会受到影响。
3、list整体实现
这里我们在整体实现的时候仍然采取分文件的做法,test.cpp用来包含所要的头文件,list.h用来实现list的主体内容。
test.cpp
#define _CRT_SECURE_NO_WARNINGS #include<iostream> #include<assert.h> using namespace std; #include"list.h" int main() { pjb::test1(); return 0; }
list.h
#pragma once//防止头文件被多次包含 namespace pjb { template<class T> struct list_node { list_node* _next; list_node* _prev; T _data; list_node(const T& x) :_next(nullptr) , _prev(nullptr) , _data(x) {} }; //定义迭代器 template <class T,class Ref,class Ptr> struct __list_iterator { typedef list_node<T> node; typedef __list_iterator<T, Ref, Ptr> Self; node* _pnode; //初始化 __list_iterator(node* p) :_pnode(p) {} Ptr operator->() { return &_pnode->_data; } Ref operator*() { return _pnode->_data; } Self& operator++() { _pnode = _pnode->_next; return *this; } Self operator++(int) { Self tmp(*this); _pnode = _pnode->_next; return tmp; } Self& operator--() { _pnode = _pnode->prev; return *this; } Self operator--(int) { Self tmp(*this); _pnode = _pnode->_prev; return tmp; } bool operator!=(const Self it)const { return _pnode != it._pnode; } bool operator==(const Self& it)const { return _pnode == it._pnode; } }; //定义lsit的类 template<class T> class list { typedef list_node<T> node; public: typedef __list_iterator<T, T&, T* >iterator; typedef __list_iterator<T, const T&,const T*> const_iterator; //初始化哨兵位的头 void empty_initialize() { _head = new node(T()); _head->_next = _head; _head->_prev = _head; _size = 0; } //构造函数 list() { empty_initialize(); } //析构函数 ~list() { clear(); //清除头节点 delete _head; _head = nullptr; } void clear() { iterator it = begin(); while (it != end()) { it = erase(it); } } template <class InputIterator> list(InputIterator first, InputIterator last) { empty_initialize(); while (first != last) { push_back(*first); ++first; } } const_iterator begin() const { return const_iterator(_head->_next); } const_iterator end() const { return const_iterator(_head); } iterator begin() { return iterator(_head->_next); } iterator end() { return iterator(_head); } //交换 void swap(list<T>& lt) { std::swap(_head, lt._head); std::swap(_size, lt._size); } //lt2(lt1) list(const list<T>& lt) { empty_initialize(); list<T> tmp(lt.begin(), lt.end()); swap(tmp); } //lt3 = lt1 list<T>& operator=(list<T> lt) { swap(lt); return *this; } //删除 iterator erase(iterator pos) { assert(pos != end()); node* prev = pos._pnode->_prev; node* next = pos._pnode->_next; prev->_next = next; next->_prev = prev; delete pos._pnode; --_size; return iterator(next); } //插入 iterator insert(iterator pos, const T& x) { //为插入申请新空间 node* newnode = new node(x); node* cur = pos._pnode;//指向要插入位置的节点 node* prev = cur->_prev; prev->_next = newnode; newnode->_prev = prev; newnode->_next = cur; cur->_prev = newnode; ++_size; return iterator(newnode);//返回新节点的地址 } //尾插 void push_back(const T& x) { insert(end(),x); } //头插 void push_front(const T& x) { insert(begin(), x); } //尾删除 void pop_back() { erase(--end()); } bool empty()const { return _size == 0; } size_t size()const { return _size; } private: node* _head; size_t _size; }; //简单测试 void test1() { list<int> lt; lt.push_back(1); lt.push_back(2); lt.push_back(3); lt.push_back(4); list<int>::iterator it = lt.begin(); while (it != lt.end()) { cout << *it << " "; ++it; } cout << endl; } }
这里我们看到模拟实现的时候,我们还写了一个测试案例,下面去验证一下
三、list和vector的对比
1、对比二者的优缺点
vector
Vector的优缺点 |
|
优点 |
缺点 |
下标支持随机访问 |
前面部分效率低O(N) |
尾插尾删效率高 |
扩容有消耗,存在一定的空间浪费 |
Cpu高速缓存命中高 |
list
list的优缺点 |
|
优点 |
缺点 |
按需申请空间,无需扩容 |
不支持随机访问 |
任意位置插入删除O(1) |
Cpu高速缓存命中低 |
2、list和vector的排序效率
这里我们要注意的是list有自己专门sort排序,而vector是用算法库中的排序,这是因为list的结构的特殊性,算法库中的不能够满足list的排序。
那二者那个效率更好呢?
测试10万个数据二者的排序时间的差异:
void test_op() { srand(time(0)); const int N = 100000; vector<int> v; v.reserve(N); list<int> lt; for (int i = 0; i < N; ++i) { auto e = rand(); v.push_back(e); lt.push_back(e); } int begin1 = clock(); //对v排序 sort(v.begin(), v.end()); int end1 = clock(); int begin2 = clock(); //对lt排序 lt.sort(); int end2 = clock(); printf("vector sort:%d\n", end1 - begin1); printf("list sort:%d\n", end2 - begin2); } int main() { test_op(); return 0; }
从上面来看vector的排序效率是远大于list的,所以我们一个尽量不要使用list的排序。