关联式容器
在之前的文章中接触过STL部分容器,例如:vector、list、deque等等,这些容器统称为序列式容器,也称为顺序容器。
关联式容器和顺序容器有着根本的不同:关联容器中的元素是按照关键字来保存和访问的;而顺序容器中的元素是按它们在容器中的位置来顺序保存和访问的。
关联容器是用来存储数据的,与顺序容器不同的是,其里面存储的是< key,value >结构的键值对应,在数据检索时比序列容器效率更高。
关联式容器支持高效的关键字查找和访问。俩个主要的关联容器是map和set。map中的元素是一些关键字-值(key-value)对:关键字起到索引的作用,值则表示与索引相关联的数据;set中每一个元素只包含一个关键字,set支持高效的关键字查询操作:检查一个给定关键字是否在set中。
键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含包含俩个成员变量key与value,key代表键值,value代表与key对应的信息。
SGI-STL中键值对的定义:
template <class T1, class T2> struct pair { typedef T1 first_type; typedef T2 second_type; T1 first; T2 second; pair() : first(T1()), second(T2()) {} pair(const T1& a, const T2& b) : first(a), second(b) {} };
树形结构的关联式容器
在STL库中一共提供了8中关联容器,根据应用场景的不同,又可以将其分为俩种不同结构的管理式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为底层结果,容器中的元素是一个有序的列表。
而在STL中的8个容器间的不同体现在三个不同维度上:
- 或者是一个set,或者是一个map;
- 或者要求不重复的关键字,或者允许重复关键字;
- 按顺序保存元素,或无序保存。
按照关键字有序保存元素 | |
map | 关联数组;保存关键字-值对 |
set | 关键字即值,即只保存关键字的容器 |
multimap | 关键字可以重复出现的map |
multiset | 关键字可以重复出现的set |
无序排列 | |
unordered_map | 用哈希函数组织的map |
unordered_set | 用哈希函数组织的set |
unordered_multimap | 哈希组织的map;关键字可以重复出现 |
unordered_multiset | 哈希组织的set;关键字可以重复出现 |
set
set的文档介绍
【解释说明】
- set是按照一定次序存储元素的容器。
- 在set中,元素的value也标识着(value就是key、类型是T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或者删除它们。
- 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
- set容器通过key访问元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
- set在底层是使用二叉搜索树(红黑树)实现的。
set的特殊作用是可以用于去重;其去重原理是:当值已经存在,就不进行插入。
set的使用
set的模板参数说明
在set的模板参数列表可以看到,set有三个模板参数,分别是:
- T:set中存放元素的类型,实际在底层存储< value , value >的键值对。
- compare:set中元素默认按照小于来比较。
- Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理。
set的构造
set的构造
函数声明 | 功能介绍 |
explicit set (const key_compare& comp = key_compare(), const allocator_type& alloc = allocator_type()); | 构造空的set |
template <class InputIterator> set (InputIterator first, InputIterator last, const key_compare& comp = key_compare(),const allocator_type& alloc = allocator_type()); |
同[first,lats)区间中的元素构造set |
set (const set& x); |
set的拷贝构造 |
set<int> s1; int arr[] = { 1,2,3,4,5 }; set<int> s2(arr, arr + 5); set<int> s3(s2); set<int> s4(s2.begin(), s2.end());
set的迭代器
iterator begin();
返回set中起始位置元素的迭代器。
const_iterator begin() const;
返回set中起始位置元素的const迭代器。
iterator end();
返回set中最后一个元素后面的迭代器。
const_iterator end() const;
返回set中最后一个元素后面的const迭代器。
reverse_iterator rbegin();
返回set第一个元素的反向迭代器,即end
const_reverse_iterator rbegin() const;
返回set第一个元素的反向const迭代器
reverse_iterator rend();
返回set最后一个元素下一个位置的反向迭代器,即begin
const_reverse_iterator rend() const;
返回set最后一个位置的const反向迭代器。
int arr[] = { 1,3,4,2,5 }; set<int> s(arr, arr + 5); set<int>::iterator it = s.begin(); while (it != s.end()) { cout << *it << " "; ++it; } cout << endl;
set的容量
bool empty() const;
检测set是否为空,空返回true,否则返回true。
int arr[] = { 1,3,4,2,5 }; set<int> s(arr, arr + 5); if (!s.empty()) { cout << "非空" << endl; }
size_type size() const;
返回set中有效元素的个数。
set<int> s; for (int i = 1; i < 10; ++i) { s.insert(i * 10); } cout << s.size() << endl;
set的修改操作
pair insert (const value_type& val);
在set中插入元素x,实际插入的是< x,x >构成的键值对,如果插入成功,返回< 该元素在set中的位置,true >,如果插入失败,说明x在set中已经存在,返回< x在set中的位置,false >。
set<int> s; for (int i = 1; i < 10; ++i) { s.insert(i * 10); } set<int>::iterator it = s.begin(); while (it != s.end()) { cout << *it << " "; ++it; } cout << endl;
void erase (iterator position);
删除set中position位置上的元素。
size_type erase (const value_type& val);
删除set中值为x的元素,返回删除的元素的个数。
void erase (iterator first, iterator last);
删除set中[first,last)区间中的元素。
set<int> s1; for (int i = 1; i < 10; ++i) { s1.insert(i * 10); } s1.erase(10); s1.erase(15); for (auto e : s1) { cout << e << " "; }
void swap (set& x);
交换set中的元素。
set<int> s1; for (int i = 1; i < 10; ++i) { s1.insert(i * 10); } set<int> s2; s1.swap(s2); for (auto e : s1) { cout << e << " "; }
void clear();
将set中的元素清空。
set<int> s; for (int i = 1; i < 10; ++i) { s.insert(i * 10); } s.clear();
iterator find (const value_type& val) const;
返回set中值为x的元素的位置。
【注意】set的find()函数与库中的find()函数的底层实现不同,find()属于比较查找,时间复杂度最大为O(N),而库里面的find()属于暴力查找,时间复杂度为O(N)。
set<int> s; for (int i = 1; i < 10; ++i) { s.insert(i * 10); } if (s.find(10) != s.end()) { cout << "找到了" << endl; }
size_type count (const value_type& val) const;
返回set中值为x的元素的个数。
【注意】count用于判断是否存在,因为里面的数据在set里面只能为1个或者没有,如果在multiset里则会不同。
set<int> s; for (int i = 1; i < 10; ++i) { s.insert(i * 10); } if (s.count(10)) { cout << "找到了" << endl; }
iterator lower_bound (const value_type& val) const;
将迭代器返回到下限。
【注意】lower_bound()函数找的是大于等于该值的数据
set<int> s; for (int i = 1; i < 10; ++i) { s.insert(i * 10); } set<int>::iterator itlow, itup; itlow = s.lower_bound(30); itup = s.upper_bound(50); s.erase(itlow, itup); for (auto e : s) { cout << e << " "; }
iterator upper_bound (const value_type& val) const;
将迭代器返回至上限。
【注意】upper_bound()函数找的是大于该值的数据
set<int> s; for (int i = 1; i < 10; ++i) { s.insert(i * 10); } set<int>::iterator itlow, itup; itlow = s.lower_bound(30); itup = s.upper_bound(50); s.erase(itlow, itup); for (auto e : s) { cout << e << " "; }
pair equal_range (const value_type& val) const;
获得相等元素的范围。
set<int>::iterator itlow, itup; std::pair<std::set<int>::const_iterator, std::set<int>::const_iterator> ret; ret = s.equal_range(20); itlow = ret.first; itup = ret.second; s.erase(itlow, itup); for (auto e : s) { cout << e << " "; }
【总结】
- 与map和multimap不同,map和multimap中存储的是真正的键值对< key,value >,set中只放value,但在底层实际存放的是由< value,value >构成的键值对。
- set中插入元素时,只需要插入value即可,不需要构造键值对。
- set中的元素不可以重复,所以可以使用set进行去重。
- 使用set的迭代器遍历set中的元素,可以得到有序序列。
- set中的元素默认是按照小于来比较。
- set中查找某个元素,时间复杂度为logN。
- set中的元素不允许修改。
- set中的底层实现是使用二叉搜索树(红黑树)来实现的。
multiset
multiset的介绍
【文档说明】
- multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
- 在multiset中,元素的value也会识别自己,因为multiset中本身存储的就是< value,value >组成的键值对,因此value本身就是key,key就是value,类型为T。
- multiset元素的值不能再容器中进行修改,因为元素总是const的,但可以从容器中插入或删除。
- multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当时用迭代器遍历时会得到一个有序序列。
- multiset底层结构为二叉搜索树(红黑树)。
multiset的使用
int arr[] = { 3,2,6,4,7,1,9,4,0,2,2,3,4,5,6,6,5,4 }; multiset<int> s(arr, arr + (sizeof(arr) / sizeof(arr[0]))); for (auto& e : s) { cout << e << " "; } cout << endl; //寻找第一个3的位置 multiset<int>::iterator pos = s.find(3); while (pos != s.end()) { cout << *pos << " "; ++pos; } cout << endl; cout << s.count(6) << endl; pair<multiset<int>::const_iterator, multiset<int>::const_iterator> ret = s.equal_range(4); multiset<int>::iterator itlow, itup; itlow = ret.first; itup = ret.second; s.erase(itlow, itup); for (auto& e : s) { cout << e << " "; } cout << endl;
count和equal_range俩个函数在multiset中的使用更加有意义,equal_range寻找的范围是相等值的左闭右开。
【注意】
- multiset中在底层中存储的是< value,value >的键值对。
- multiset的插入接口只需要插入即可。
- 与set的区别是,multiset中的元素可以重复,在set中的元素是唯一的。
- 使用迭代器对multiset中的元素访问进行遍历,可以得到有序的序列。
- multiset中的元素不能修改。
- 在multiset中查找某个元素,时间复杂度为logN。
- multiset的作用:可以对元素进行排序。
map
map的文档介绍
【解释说明】:
- map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
- 在map中,键值key通常用于排序和唯一的标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,可以与value通过成员类型value_type绑定在一起,为其取别名称为pair。
- 在内部,map中的元素总是按照键值key进行比较排序的。
- map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
- map支持下标访问符,即在[ ]中放入key,就可以找到key对应的value。
- map通常被实现为二叉搜索树,更加准确的将:平衡二叉搜索树(红黑树)。
map的使用
map的模板参数说明
map中一共存在四个模板参数,分别为:
key:键值对中key的类型。
T:键值对中value的类型。
Compare:比较器的类型,map中的元素是按照key进行比较的,缺省情况下按照小于来比较,一般情况下内置类型元素不需要传递,如果自定义类型无法比较时,需要用户自己显式传递比较规则,一般情况下按照函数指针或者仿函数来传递。
Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器。
【注意】在使用map时,需要包含头文件。
map的构造
explicit map (const key_compare& comp = key_compare(),const allocator_type& alloc = allocator_type());
构造一个空的map
map<string, int> dict;
map的迭代器
begin()与end()
begin首元素的位置,end最后一个元素的下一个位置。
rbegin()和rend()
反向迭代器,rbegin在end的位置,rend在begin的位置,其++和- -操作与begin和end操作移动相反。
map<string, string>::iterator it = dict.begin(); while (it != dict.end()) { cout << it->first << ":" << it->second << endl; ++it; } cout << endl;
map的容量与元素访问
bool empty() const;
检测map中的元素是否为空,是返回true,否则返回false。
size_type size() const;
返回map中的有序元素的个数。
mapped_type& operator[] (const key_type& k);
返回key对应的value。
map<string, string> dict; dict["sort"];//插入 dict["map"] = "地图";//插入修改 dict["map"] = "映射";//修改
operator[]的原理是:用< key,T() >构造一个键值对,然后调用insert()函数将该键值对插入到map中,如果key已经存在,插入失败,insert函数返回该key所在位置的迭代器;如果key不存在,插入成功,insert函数返回新插入元素所在位置的迭代器。
operator[]函数最后将insert返回值键值对中的value返回。
【注意】在元素访问的时候,有一个与operator[ ]类似的操作at(),该函数不经常使用,俩个函数都是通过key找到与key对应的value然后返回其引用,但是不同点是:当key不存在时,operator[ ]用默认value与key构造键值对然后插入,返回该默认value,而at()函数直接抛异常。
map的修改操作
pair insert (const value_type& val);
在map中插入键值对x,注意x是一个键值对,返回值也是键值对:iterator代表新插入元素的位置,bool代表是否插入成功。
//查找高频单词 map<string, string> dict; pair<string, string> kv1("insert", "插入"); dict.insert(kv1); dict.insert(pair<string, string>("string", "字符串")); //C++98 dict.insert(make_pair("sort", "排序")); //C++11 dict.insert({ "data","数据" });
C++11中支持多参数的构造函数隐式类型转换。pair是一个类模板。
void erase (iterator position);
删除position位置上的元素。
size_type erase (const key_type& k);
删除键值为x的元素。
void erase (iterator first, iterator last);
删除[first,last)区间中的元素。
void swap (map& x);
交换俩个map中的元素。
void clear();
将map中的元素清空。
iterator find (const key_type& k);
在map中插入key为x的元素,找到返回该元素的位置的迭代器,否则返回end。
const_iterator find (const key_type& k) const;
在map中国插入key为x的元素,找到返回该元素的位置的const迭代器,否则返回rend。
size_type count (const key_type& k) const;
返回key为x的键值在map中的个数,注意map中key唯一的,因此该函数的返回值要么为0,要么为1,因此也可以用该函数来检测一个key是否在map中。
iterator lower_bound (const key_type& k);
const_iterator lower_bound (const key_type& k) const;
返回迭代器的下限。
iterator upper_bound (const key_type& k);
const_iterator upper_bound (const key_type& k) const;
返回迭代器的上限。
获取相等元素的范围。
【总结】
- map中的元素是键值对。
- map中key是唯一的,并且不能修改。
- 默认按照小于的方式对key进行比较。
- map中的元素如果用迭代器去遍历,可以得到一个有序的序列。
- map的底层为平衡搜索树(红黑叔),查找效率比较高logN。
- 支持[ ]操作符,operator[ ]中实际进行插入查找。
multimap
multimap的介绍
【文档说明】
- multimap是关联式容器,按照特定的顺序,存储由key和value映射成的键值对< key,value >,其中多个键值对直接的key是可以重复的。
- 在multimap中,通常按照key排序和唯一的标识元素,而映射的value存储与key关联的内容。
- key与value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对。
- 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key继续排序。
- multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
- multimap在底层用二叉搜索树(红黑树)实现的。
【注意】multimap和map的唯一不同就是:map中的key是唯一的,而multimap中的key是可以重复的。
multimap的使用
【注意】
- multimap中的key是可以重复的。
- multimap中的元素默认将key按照小于来比较。
- multimap中没有重载operator[ ]操作。
- 使用时与map包含的头文件相同。