Java容器 | 基于源码分析Map集合体系

简介: 集合体系的源码中,Map中的HashMap的设计堪称最经典,涉及数据结构、编程思想、哈希计算等等,在日常开发中对于一些源码的思想进行参考借鉴还是很有必要的。

一、容器之Map集合

集合体系的源码中,Map中的HashMap的设计堪称最经典,涉及数据结构、编程思想、哈希计算等等,在日常开发中对于一些源码的思想进行参考借鉴还是很有必要的。

02-1.png

  • 基础:元素增查删、容器信息;
  • 进阶:存储结构、容量、哈希;

API体系

在整个Map和Set的API体系中,最重要的就是HashMap的实现原理:

  • HashMap:基于哈希表管理元素;
  • LinkedHashMap:基于HashMap和双向链表;
  • HashSet:底层维护HashMap结构;
  • LinkedHashSet:继承HashSet,双向链表;

所以Map和Set的系列中,除特殊API之外,基本原理都依赖HashMap,只是在各自具体实现时,适用于不同特点的元素管理。

二、数据结构

在看HashMap之前,先理解一种数据结构:数组+链表的结构。

02-2.png

基于数组管理元素的位置,元素的存储形成链表结构,既然是链表那么就可以是单双向的结构,这需要针对具体的API去分析,通过这个结构可以得到几个关键信息:

  • 扩容:基于数组则面对扩容问题;
  • 链表:形成链表结构的机制;
  • 哈希:哈希值计算与冲突处理;

三、HashMap详解

1、结构封装

既然上面简单描述了数组+链表的结构,那么从源码角度看看是如何封装的:

transient Node<K,V>[] table;

在HashMap中数组结构的变量命名为table(表),并且是基于Node<K,V>的节点:

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    V value;
    Node<K,V> next;
}

实现Map.Entry接口,并定义节点的结构变量,和节点自身的相关方法。

2、构造方法

在知道HashMap中的基础结构后,可以看其相关的构造方法,初始化哪些变量:

无参构造

public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
}
  • float DEFAULT_LOAD_FACTOR = 0.75f;
  • this.loadFactor = DEFAULT_LOAD_FACTOR;

实际上还要关注一个核心参数:

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // 16

即数组默认的初始化容量DEFAULT_INITIAL_CAPACITY为16,扩容的阈值loadFactor为0.75,即表示当数组中元素达到12个便会进行扩容操作。

有参构造

当然也可以通过有参构造方法去设置两个参数:即容量和扩容的阈值:

public HashMap(int initialCapacity, float loadFactor) ;

通过两个构造方法的源码可知:当直接创建新的HashMap的时候,不会立即对哈希数组进行初始化,但是可以对关键变量做自定义设置。

3、装载元素

顺着HashMap的使用方法,看元素添加:

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

在put的时候并没有做过多直接操作,而是调用两个关键方法:

  • hash():计算key的hash值;
  • putVal():元素添加过程;

这里必须看一个关键方法,哈希值的计算:

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

并不是直接获取Object中hashCode的返回值,计算key对应的hashCode值,和hashCode值右移16位的值,并对两个结果进行异或运算,以此拉低哈希冲突发生的概率。

再看putVal()方法,这里的操作就相当精彩:

02-3.jpeg

核心步骤总结:

  • 首次执行判断并初始化底层数组;
  • 基于哈希值计算结果添加元素;
  • 根据添加元素后的容量来判断是否扩容;

这里还需要说明一个问题:

HashMap基于红黑树来处理哈希冲突问题,如果hash冲突过多,对O(n)的查询性能的影响非常大,当冲突节点链表的冲突元素数量到达8时,并且数组的长度到达64时,会使用红黑树结构代替链表来处理哈希冲突的查询性能问题,关于树结构可以移步之前的相关文章。

4、自动化扩容

容器在一定边界内可以不断添加元素,其核心的机制就是扩容,HashMap的扩容遵循最小可用原则,当然容量到达阈值,便会触发自动扩容机制。

阈值:threshold=capacity*loadFactor,默认即 16*0.75=12

核心方法:resize;

02-4.jpeg

核心步骤总结:

  • 判断扩容的边界参数:threshold;
  • 核心参数计算:容量和阈值;
  • 基于新参数创建一个新的空数组;
  • 原数组为null则过程可以理解为初始化;
  • 原数组不为null则扩容并迁移数据;

很显然如果涉及数组扩容则会很影响效率,所以在日常开发中,可以在使用HashMap的时候预先估计好HashMap的大小,保证阈值大于存储的元素数量,尽可能避免进行多次扩容操作。

5、查询元素

getNode查找方法,通过hash值的计算,然后依次经过数组、红黑树、链表进行遍历查询:

02-5.jpeg

6、删除元素

removeNode删除方法,首先通过hash值的计算,找到要删除的节点,然后判断索引位置是红黑树还是链表结构,分别执行各自的删除流程:

02-6.jpeg

7、补充说明

这里对两个方法做个简单的说明:hashCode()equals(),通常来说重写equals方法的时候需要重写hashCode方法。

02-7.jpeg

这两个方法都可以用来比较两个对象是否相等,但是hash值有存在冲突的情况,可能存在两个对象的hash值冲突,这时候可以通过equals判断对象值是否相同,==判断值对象,地址判断引用对象。

在HashMap的结构中,链表上的hash值相同情况还要通过equals方法来判断具体值是否相同,才能找到相应的对象。

END


相关文章
|
2月前
|
Java 虚拟化 容器
(Java)Java里JFrame窗体的基本操作(容器布局篇-1)
容器 容器,我的理解是可以包容其他东西的玩意。它可以是一个盒子,可以是一个虚拟化的物品,可只要能包裹住其他存在质体的东西,那么都可以称作是容器。例如:JPanel组件和JScollPane组件两者都是容器也是组件。 既然有容器,那么容器中的布局就必不可少了。不然不规矩的摆放物品,人类看不习惯,我也看不习惯 ???? 本篇内容,将说明java JFrame窗体里容器中几类布局。 说明:所有在JFrame窗体里的容器布局都会使用setLayout()方法,采用的布局参数都将放进这个方法里 绝对布局 调用窗体容器
118 1
|
6月前
|
安全 Java 数据库连接
让我们讲解一下 Map 集合遍历的方式
我是小假 期待与你的下一次相遇 ~
260 43
|
6月前
|
存储 缓存 安全
Java 集合容器常见面试题及详细解析
本文全面解析Java集合框架,涵盖基础概念、常见接口与类的特点及区别、底层数据结构、线程安全等内容。通过实例讲解List(如ArrayList、LinkedList)、Set(如HashSet、TreeSet)、Map(如HashMap、TreeMap)等核心组件,帮助读者深入理解集合容器的使用场景与性能优化。适合准备面试或提升开发技能的开发者阅读。
120 0
|
6月前
|
缓存 Java API
Java 集合容器实操技巧与案例详解
本教程基于Java 8+新特性和现代开发实践,深入讲解Java集合容器的实操技巧。通过具体场景演示Stream API数据处理、ConcurrentHashMap并发控制、LinkedHashMap实现LRU缓存、TreeSet自定义排序等高级特性。同时涵盖computeIfAbsent优化操作、EnumMap专用集合使用、集合统计与运算(交集、并集、差集)等内容。代码示例丰富,助力掌握高效编程方法。[点击获取完整代码](https://pan.quark.cn/s/14fcf913bae6)。
89 0
|
存储 Java 容器
HashMap 的基本操作【集合容器知识回顾 ⑤】
本文介绍了HashMap的基本操作,包括创建对象、添加、获取、删除和替换元素、获取所有key的集合、遍历HashMap,以及如何存储自定义类型键值对,并强调了当使用自定义对象作为键时需要重写equals和hashCode方法以确保正确的行为。
HashMap 的基本操作【集合容器知识回顾 ⑤】
|
10月前
|
存储 安全 算法
Java容器及其常用方法汇总
Java Collections框架提供了丰富的接口和实现类,用于管理和操作集合数据。
192 2
Java容器及其常用方法汇总
使用 entrySet 遍历 Map 类集合 KV
使用 entrySet 遍历 Map 类集合 KV
|
11月前
|
监控 Java 中间件
8G的容器Java堆才4G怎么就OOM了?
本文记录最近一例Java应用OOM问题的排查过程,希望可以给遇到类似问题的同学提供参考。
|
存储 安全 Java
Java多线程编程中的并发容器:深入解析与实战应用####
在本文中,我们将探讨Java多线程编程中的一个核心话题——并发容器。不同于传统单一线程环境下的数据结构,并发容器专为多线程场景设计,确保数据访问的线程安全性和高效性。我们将从基础概念出发,逐步深入到`java.util.concurrent`包下的核心并发容器实现,如`ConcurrentHashMap`、`CopyOnWriteArrayList`以及`BlockingQueue`等,通过实例代码演示其使用方法,并分析它们背后的设计原理与适用场景。无论你是Java并发编程的初学者还是希望深化理解的开发者,本文都将为你提供有价值的见解与实践指导。 --- ####
|
Java
Java基础之 JDK8 HashMap 源码分析(中间写出与JDK7的区别)
这篇文章详细分析了Java中HashMap的源码,包括JDK8与JDK7的区别、构造函数、put和get方法的实现,以及位运算法的应用,并讨论了JDK8中的优化,如链表转红黑树的阈值和扩容机制。
221 1