HashMap中putMapEntries()方法源码详解

简介: HashMap中putMapEntries()方法源码详解

一、源码解读

在HashMap中,我们通常使用public void putAll()方法对传入的map集合进行批量插入

public void putAll(Map<? extends K, ? extends V> m) {
    putMapEntries(m, true);
}

该方法直接调用putMapEntries()方法,因此我们对其重点关注。

putMapEntries()方法是所有存放批量数据的核心方法。由于是存放批量数据,所以聪明的小伙伴可能会想到是遍历一个数据集合并对集合中的每一条数据调用putVal()方法进行存放。如果有不了解putVal()方法的小伙伴,可以参考前面的文章[HashMap中put()方法源码解读] ,下面我们贴上源码来分析一下

final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
    // 获取集合大小,
    int s = m.size();
    if (s > 0) {
        // 如果底层数组尚未实例化,则需要计算出满足该数据量的数组长度和响应的阈值,避免在保存数据的时候频繁扩容
        if (table == null) { // pre-size
            float ft = ((float)s / loadFactor) + 1.0F;
            int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                     (int)ft : MAXIMUM_CAPACITY);
            if (t > threshold)
                threshold = tableSizeFor(t);
        }
        // 如果底层数组已经实例化过了,且要保存的数据量大于扩容阈值,则进行扩容
        else if (s > threshold)
            resize();
        // 将参数map集合,转换为entry的set集合,并对每一个entry进行遍历,通过putVal()将每一个entry中的key和value保存到哈希表中
        for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
            K key = e.getKey();
            V value = e.getValue();
            putVal(hash(key), key, value, false, evict);
        }
    }
}

这个方法其实没什么好说的,无非就是判断底层数组是否需要扩容,然后对map集合进行批量插入。但即使是批量插入,最终也是循环调用putVal()方法将集合数据逐个插入的。

其中有一行代码对于初次阅读源码的同学可能有所疑惑

final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
    // ...
    float ft = ((float)s / loadFactor) + 1.0F;
    // ...
}

((float)s / loadFactor) + 1.0F; 为什么要将 集合大小s 除以 加载因子loadFactor 的值 再加一 呢?

首先我们要知道执行这行代码的前提是底层数组为空,因此在批量插入后,集合大小就是当前hashMap对象的数据量了。还有一个就是HashMap的扩容机制是当数据量 = 底层数组长度 * 加载因子loadFactor 时,需要扩容。也就是说,当 数据量 / 加载因子loadFactor = 底层数组长度 时需要对其扩容。因此,如果我们把底层数组的初始长度设置为 数据量 / 加载因子loadFactor 时,其实就需要第二次扩容了,为了避免这第二次扩容,将其商值加一是非常不错的办法。

所以 集合大小s 除以 加载因子loadFactor 的值 再加一 就是为了在确定底层数组长度时一步到位,避免频繁扩容。同时也可以使底层数组的空间利用率最大化。


二、缺陷

说到这里,我发现putMapEntries()这个方法有个比较矛盾的地方,不知道大家注意到没有

else if (s > threshold)这个代码块中,如果结果为true,则执行一次resize()进行扩容。我们来分析一下:

进入该代码块的前提是底层数组已经实例化过了,其扩容阈值为threshold,当我们要插入的集合map的数据量s大于该阈值时,进行一次扩容。问题来了

如果集合map的数据量大于该阈值,仅扩容一次就够了吗?

试想一下,数组长度为16,则阈值为12,当前哈希表中有11个 <key,value> 键值对。此时我需要批量插入一个数据量为100的数据量,按照源码进行一次扩容,扩容后的数组长度为32,则阈值为24,而我要插入100个 <key,value> 键值对,况且现在已经存在11个了,这种情况下,在遍历集合并调用putVal()方法保存数据时,依然会进行多次扩容,直到数组长度为256,阈值为192,也就是说在遍历期间将会再扩容3次

因此,集合map的数据量大于该阈值,仅扩容一次可能是不够的,为什么不能像上面那样一步到位,从而避免频繁扩容呢?

所以我说这个方法比较矛盾,是因为它既做到了一步到位,又没有做到一步到位。

相关文章
|
24天前
|
Java
让星星⭐月亮告诉你,HashMap中保证红黑树根节点一定是对应链表头节点moveRootToFront()方法源码解读
当红黑树的根节点不是其对应链表的头节点时,通过调整指针的方式将其移动至链表头部。具体步骤包括:从链表中移除根节点,更新根节点及其前后节点的指针,确保根节点成为新的头节点,并保持链表结构的完整性。此过程在Java的`HashMap$TreeNode.moveRootToFront()`方法中实现,确保了高效的数据访问与管理。
27 2
|
24天前
|
Java 索引
让星星⭐月亮告诉你,HashMap之往红黑树添加元素-putTreeVal方法源码解读
本文详细解析了Java `HashMap` 中 `putTreeVal` 方法的源码,该方法用于在红黑树中添加元素。当数组索引位置已存在红黑树类型的元素时,会调用此方法。具体步骤包括:从根节点开始遍历红黑树,找到合适位置插入新元素,调整节点指针,保持红黑树平衡,并确保根节点是链表头节点。通过源码解析,帮助读者深入理解 `HashMap` 的内部实现机制。
30 2
|
24天前
|
存储
让星星⭐月亮告诉你,HashMap的put方法源码解析及其中两种会触发扩容的场景(足够详尽,有问题欢迎指正~)
`HashMap`的`put`方法通过调用`putVal`实现,主要涉及两个场景下的扩容操作:1. 初始化时,链表数组的初始容量设为16,阈值设为12;2. 当存储的元素个数超过阈值时,链表数组的容量和阈值均翻倍。`putVal`方法处理键值对的插入,包括链表和红黑树的转换,确保高效的数据存取。
50 5
|
24天前
|
算法 索引
让星星⭐月亮告诉你,HashMap的resize()即扩容方法源码解读(已重新完善,如有不足之处,欢迎指正~)
`HashMap`的`resize()`方法主要用于数组扩容,包括初始化或加倍数组容量。该方法首先计算新的数组容量和扩容阈值,然后创建新数组。接着,旧数组中的数据根据`(e.hash & oldCap)`是否等于0被重新分配到新数组中,分为低位区和高位区两个链表,确保数据迁移时的正确性和高效性。
62 3
|
24天前
|
算法 索引
HashMap扩容时的rehash方法中(e.hash & oldCap) == 0算法推导
HashMap在扩容时,会创建一个新数组,并将旧数组中的数据迁移过去。通过(e.hash & oldCap)是否等于0,数据被巧妙地分为两类:一类保持原有索引位置,另一类索引位置增加旧数组长度。此过程确保了数据均匀分布,提高了查询效率。
36 2
|
24天前
|
Java 索引
让星星⭐月亮告诉你,HashMap中红黑树TreeNode的split方法源码解读
本文详细解析了Java中`HashMap`的`TreeNode`类的`split`方法,该方法主要用于在`HashMap`扩容时将红黑树节点从旧数组迁移到新数组,并根据`(e.hash & oldCap)`的结果将节点分为低位和高位两个子树。低位子树如果元素数少于等于6,则进行去树化操作;若多于6且高位子树非空,则进行树化操作,确保数据结构的高效性。文中还介绍了`untreeify`和`replacementNode`方法,分别用于将红黑树节点转换为普通链表节点。
22 2
|
24天前
|
机器学习/深度学习 算法
让星星⭐月亮告诉你,HashMap之tableSizeFor(int cap)方法原理详解(分2的n次幂和非2的n次幂两种情况讨论)
`HashMap` 的 `tableSizeFor(int cap)` 方法用于计算一个大于或等于给定容量 `cap` 的最小的 2 的幂次方值。该方法通过一系列的无符号右移和按位或运算,逐步将二进制数的高位全部置为 1,最后加 1 得到所需的 2 的幂次方值。具体步骤包括: 1. 将 `cap` 减 1,确保已经是 2 的幂次方的值直接返回。 2. 通过多次无符号右移和按位或运算,将最高位 1 后面的所有位都置为 1。 3. 最终加 1,确保返回值为 2 的幂次方。 该方法保证了 `HashMap` 的数组容量始终是 2 的幂次方,从而优化了哈希表的性能。
31 1
|
24天前
|
存储 Java
HashMap之链表转红黑树(树化 )-treefyBin方法源码解读(所有涉及到的方法均有详细解读,欢迎指正)
本文详细解析了Java HashMap中链表转红黑树的机制,包括树化条件(链表长度达8且数组长度≥64)及转换流程,确保高效处理大量数据。
60 1
|
26天前
|
算法 Java 容器
Map - HashSet & HashMap 源码解析
Map - HashSet & HashMap 源码解析
49 0
|
6月前
|
存储 安全 Java
HashMap源码全面解析
HashMap源码全面解析