网站首页编程语言正文

当添加一个键值对元素时，HashMap发生了什么？

作者：好的OK Txtcyvy 更新时间： 2022-08-15 编程语言

HashMap内部数据结构使用数组+链表+红黑树进行存储。数组类型为Node[]，每个Node都保存了某个KV键值对元素的key、value、hash、next等值。由于next的存在，所以每个Node对象都是一个单向链表中的组成节点。

当新添加一个KV键值对元素时，通过该元素的key的hash值（添加时，通过key的hash值，使用&按位与位运算，计算该元素在数组中的下标。作用等同于hash % 数组长度。），计算该元素在数组中应该保存的下标位置。如果该下标位置如果已经存在其它Node对象（产生哈希冲突），则采用链地址法处理，即将新添加的KV键值对元素将以链表形式存储。将新元素封装成一个新的Node对象，插入到该下标位置的链表尾部（尾插法）。当链表的长度超过8并且数组长度大于64时，为了避免查找搜索性能下降，该链表会转换成一个红黑树。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

//转换为红黑树
final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            //遍历链表结点，转换为红黑树
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

HashMap初始容量：

HashMap通过key的hashCode()得出一个hash值，并且通过这个hash值计算数组位置下标。hashCode()返回的int范围高达±21亿，先不考虑负数，HashMap内部使用的数组得有多大？
首先HashMap初始化时，默认的数组大小只有16，通过位运算1<<4计算得出。并且，数组的长度必须为2n （MUST be a power of two）。因为数组长度为2的n次幂时，可以使用&与位运算，结合hash值，快速计算该元素在数组中的下标位置，提高HashMap的使用效率。

HashMap的扩容机制：

HashMap底层采用数组+链表+红黑树，扩容过程中需要按照数组容量和加载因子来进行判断。
数组容量：基础数组Node<K,V>[] table的长度。如果没有指定容量，添加第一个元素时，该数组按照默认值16进行初始化。
加载因子：用来表示HashMap集合中元素的填满程度，默认为0.75f。越大则表示允许填满的元素就越多，集合的空间利用率就越高，但是冲突的机会增加。反之，越小则冲突的机会就会越少，但是空间很多就浪费。

什么时候扩容？
HashMap的扩容方法是resize()方法，发生下列两种情况时，会发生扩容：
1：HashMap中的元素个数超过扩容阈值threshold时，就会进行数组扩容（扩容阈值threshold = 数组容量 × 加载因子）。例如：加载因子(LoadFactor)的默认值为0.75f，数组容量默认为16，当HashMap中元素个数超过16 × 0.75=12的时候，数组就会扩容（HashMap扩容时，会按照当前数组的容量扩容2倍）。

// 新容量 = 原有容量的2倍
newCap = oldCap << 1

2：HashMap加入新元素时，如果链表长度大于8时，会将当前链表转换为红黑树。在转换红黑树之前，会判断数组长度，如果小于64，会产生数组扩容。如果数组长度大于64，才会将链表转换为红黑树。（链表属于线性查找，速度慢）

原文链接：https://blog.csdn.net/qq_50587186/article/details/126336189

上一篇：使用enum关键字定义的枚举类实现接口的情况
下一篇：基于FTP协议的文件上传与下载

网站首页 编程语言 正文

当添加一个键值对元素时，HashMap发生了什么？

相关推荐

网站首页编程语言正文