在开始详解之前,先来看看集合的框架:
可以看到Set实现了Collection接口,而Map又是一个单独存在的接口。
而最下面又分别各有两个类,分别是TreeSet(Map)和 HashSet(Map)。
TreeSet(Map)的底层是一颗搜索树(红黑树),我们在以后数据结构的进阶中会讲到;HashSet(Map)的底层是一个哈希表,这个我们等会就会说到。
那我们的Map和Set是用来干什么的呢,其实就是用来查找和搜索的;以后涉及到查找和搜索的可以选择使用这两个接口下面具体的类。
那么就正式进入本章节的正题(Tree)和(Hash)。
1.搜索树("Tree")
1.1 概念:
二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
1. 若它的左子树不为空,则左子树上所有节点的值都小于根节点的值
2. 若它的右子树不为空,则右子树上所有节点的值都大于根节点的值
3. 它的左右子树也分别为二叉搜索树
一颗简单的二叉搜索树:
1.2 操作
1.2.1 查找
具体思路如下图:
直到找到该key或者找到null就结束。
代码如下:
public TreeNode find(int val) { TreeNode cur = root; while (cur != null) { if (cur.val > val) { cur = cur.left; } else if (cur.val < val) { cur = cur.right; } if (cur.val == val) { return cur; } }
1.2.2 插入
插入思路如下:
这里也就解释了为什么一般情况下TreeSet 和 TreeMap 不可以插入相同的元素。
代码:
public void insert(int val) { if (root == null) { new TreeNode(val); return; } TreeNode cur = root; TreeNode parent = null; while (cur != null) { if(val > root.val) { parent = cur; cur = cur.right; } else if (val < root.val) { parent = cur; cur = cur .left; } else { return; } } if (val > parent.val) { parent.right = new TreeNode(val); } else if (val < parent.val) { parent.left = new TreeNode(val); } }
1.2.3 删除
删除是个重难点,删除有很多种情况,我们一个个来分析。
1. 如果我们待删除的左边为空 cur.left == null
2. 如果我们待删除的右边为空 cur.left == null
3. 如果我们待删除的右边和右边均不为空
每种情况下都还有情况需要考虑
画图说明:
待删除的左边为空 cur.left == null :
待删除的右边为空 cur.left == null :
待删除的右边和右边均不为空:
如果我们要删的是100,那么放谁呢?
这个时候就需要使用替换法进行删除,所谓的替换法删除即在它的右子树中寻找中序下的第一个结点(关键码最小),用它的值填补到被删除节点中,再来处理该结点的删除问题。
cur的左树全部小于cur,cur的右树全部大于cur,那么就找右树中的最小值。
那么问题就改为如何删除107这个树了。
大概思路:
代码:
public void remove(int val) { TreeNode cur = root; TreeNode parent = null; while (cur != null) { if(cur.val == val) { removeNode(parent,cur); return; }else if(cur.val < val) { parent = cur; cur = cur.right; }else { parent = cur; cur = cur.left; } } } private void removeNode(TreeNode parent, TreeNode cur) { if(cur.left == null) { if(cur == root) { root = cur.right; }else if(parent.left == cur) { parent.left = cur.right; }else { parent.right = cur.right; } }else if(cur.right == null) { if(cur == root) { root = cur.left; }else if(parent.left == cur) { parent.left = cur.left; }else { parent.right = cur.left; } }else { TreeNode target = cur.right; TreeNode targetParent = cur; while (target.left != null) { targetParent = target; target = target.left; } cur.val = target.val; if(target == targetParent.left) { targetParent.left = target.right; }else { targetParent.right = target.right; } } }
二叉搜索树与Set和Map的关系:
TreeMap 和 TreeSet 即 java 中利用搜索树实现的 Map 和 Set;实际上用的是红黑树,而红黑树是一棵近似平衡的二叉搜索树,即在二叉搜索树的基础之上 + 颜色以及红黑树性质验证,关于红黑树的内容后序再进行讲解。
2. 搜索("Hash")
2.1 概念
Map和set是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。之前学的ArrayList也可以用来搜索,为什么还需学习Set和Map呢?这里就涉及到效率的问题,不同的情况下,使用的效率会不同。
以前常见的搜索方式有:
1. 直接遍历,时间复杂度为O(N),元素如果比较多效率会非常慢
2. 二分查找,时间复杂度为 ,但搜索前必须要求序列是有序的
上述排序比较适合静态类型的查找,即一般不会对区间进行插入和删除操作了,而现实中的查找比如:
1. 根据姓名查询考试成绩
2. 通讯录,即根据姓名查询联系方式
2.2 模型
一般把搜索的数据称为关键字(Key),和关键字对应的称为值(Value),将其称之为Key-value的键值对,所以模型会有两种:
1. 纯 key 模型,比如:
有一个英文词典,快速查找一个单词是否在词典中快速查找某个名字在不在通讯录中
2. Key-Value 模型,比如:
统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数:<单词,单词出现的次数>
梁山好汉的江湖绰号:每个好汉都有自己的江湖绰号
而Map中存储的就是key-value的键值对,Set中只存储了Key。
我们再次回到这个图,TreeSet(Map)都是实现了SortedMap(Set)这个接口,而Hash只实现了Map这个接口。
那么我们可以这么来写代码:
Map<Object,Object> map1 = new HashMap<>(); Map<Object,Object> map2 = new TreeMap<>();
2.3 关于Map的说明
Map是一个接口类,该类没有继承自Collection,该类中存储的是<K,V>结构的键值对,并且K一定是唯一的,不能重复。
我们也可以来查看源码:拿Map举例:
我把常用的Map方法都放在下面:
方法 | 解释 |
V get(Object key) | 返回 key 对应的 value |
V getOrDefault(Object key, V defaultValue) | 返回 key 对应的 value,key 不存在,返回默认值 |
V put(K key, V value) | 设置 key 对应的 value |
V remove(Object key) | 删除 key 对应的映射关系 |
Set<K> keySet() | 返回所有 key 的不重复集合 |
Collection<V> values() | 返回所有 value 的可重复集合 |
Set<Map.Entry<K, V>> entrySet() | 返回所有的 key-value 映射关系 |
boolean containsKey(Object key) | 判断是否包含 key |
boolean containsValue(Object value) | 判断是否包含 value |
我们知道key - value 是一个键值对,一 一对应,那么我们如何去拿到这个对应关系呢?
jdk提供了一个内部类:Map.Entry<K, V>;
说明:
Map.Entry<K, V> 是Map内部实现的用来存放<key, value>键值对映射关系的内部类,该内部类中主要提供了<key, value>的获取,value的设置以及Key的比较方式
其内部类方法如下:
方法 | 解释 |
K getKey() | 返回 entry 中的 key |
V getValue() | 返回 entry 中的 value |
V setValue(V value) | 将键值对中的value替换为指定value |
注意:
1. Map是一个接口,不能直接实例化对象,如果要实例化对象只能实例化其实现类TreeMap或者HashMap
2. Map中存放键值对的Key是唯一的,value是可以重复的
3. 在TreeMap中插入键值对时,key不能为空,否则就会抛NullPointerException异常,value可以为空。但是HashMap的key和value都可以为空。
4. Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。
5. Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。
6. Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行重新插入。
7. TreeMap和HashMap的区别
Map底层结构 | TreeMap | HashMap |
底层结构 | 红黑树 | 哈希桶 |
插入/删除/查找时间 复杂度 |
O(1) |
是否有序 | 关于Key有序 | 无序 |
线程安全 | 不安全 | 不安全 |
插入/删除/查找区别 | 需要进行元素比较 | 通过哈希函数计算哈希地址 |
比较与覆写 | key必须能够比较,否则会抛出 ClassCastException异常 |
自定义类型需要覆写equals和 hashCode方法 |
应用场景 | 需要Key有序场景下 | Key是否有序不关心,需要更高的 时间性能 |
2.4 Set 的说明
Set 的官方文档:https://docs.oracle.com/javase/8/docs/api/java/util/Set.html
常见方法说明:
方法 | 解释 |
boolean add(E e) | 添加元素,但重复元素不会被添加成功 |
void clear() | 清空集合 |
boolean contains(Object o) | 判断 o 是否在集合中 |
Iterator<E> iterator() | 返回迭代器 |
boolean remove(Object o) | 删除集合中的 o |
int size() | 返回set中元素的个数 |
boolean isEmpty() | 检测set是否为空,空返回true,否则返回false |
Object[] toArray() | 将set中的元素转换为数组返回 |
boolean containsAll(Collection<?> c) | 集合c中的元素是否在set中全部存在,是返回true,否则返回 false |
boolean addAll(Collection<? extends E> c) |
将集合c中的元素添加到set中,可以达到去重的效果 |
注意:
1. Set是继承自Collection的一个接口类
2. Set中只存储了key,并且要求key一定要唯一
3. TreeSet的底层是使用Map来实现的,其使用key与Object的一个默认对象作为键值对插入到Map中的
4. Set最大的功能就是对集合中的元素进行去重
5. 实现Set接口的常用类有TreeSet和HashSet,还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础
上维护了一个双向链表来记录元素的插入次序。
6. Set中的Key不能修改,如果要修改,先将原来的删除掉,然后再重新插入
7. TreeSet中不能插入null的key,HashSet可以。
8. TreeSet和HashSet的区别
Set与Map主要的不同有两点:Set是继承自Collection的接口类,Set中只存储了Key。
Set底层结构 | TreeSet | HashSet |
底层结构 | 红黑树 | 哈希桶 |
插入/删除/查找时间 复杂度 |
O(1) | |
是否有序 | 关于Key有序 | 不一定有序 |
线程安全 | 不安全 | 不安全 |
插入/删除/查找区别 | 按照红黑树的特性来进行插入和删除 | 1. 先计算key哈希地址 2. 然后进行 插入和删除 |
比较与覆写 | key必须能够比较,否则会抛出 ClassCastException异常 |
自定义类型需要覆写equals和 hashCode方法 |
应用场景 | 需要Key有序场景下 | Key是否有序不关心,需要更高的 时间性能 |
当然我们说到这里还是没有讲到Hash,因为篇幅有限,只能留着下一章再继续。