HashMap實(shí)現(xiàn)原理、源碼解析(jdk1.8)

HashMap實(shí)現(xiàn)原理、源碼解析(jdk1.8)




  • 正文

基本概念

  • HashMap 是最常用的集合類框架之一炬搭,它實(shí)現(xiàn)了 Map 接口蜈漓,所以存儲的元素也是鍵值對映射的結(jié)構(gòu),并允許使用 null值 和 null鍵尚蝌,其內(nèi)元素是無序的,如果要保證有序充尉,可以使用 LinkedHashMap(插入順序)飘言。
    • HashMap是線程不安全的,所以才有了 ConcurrentHashMap驼侠。也可以通過 Collections.synchronizedMap() 這個方法來使 HashMap 變?yōu)榫€程安全的姿鸿。
    • HashMap最多只允許一條記錄的鍵為null,允許多條記錄的值為null倒源。
    • 它是根據(jù)鍵的 hashCode 值來存儲數(shù)據(jù)的苛预,大多數(shù)情況下可以直接定位到它的值,因而具有很快的訪問速度笋熬,但遍歷順序卻是不確定的热某。
    • 繼承關(guān)系如下:
public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {···}

數(shù)據(jù)結(jié)構(gòu)

  • HashMap 的數(shù)據(jù)結(jié)構(gòu)是 數(shù)組 + 鏈表 + 紅黑樹(jdk1.8增加了紅黑樹部分)
  • 數(shù)組
    • 連續(xù)的內(nèi)存,通過下標(biāo)可以快速進(jìn)行尋址。
    • 插入結(jié)點(diǎn)困難
      • 當(dāng)在數(shù)組中插入一個元素時昔馋,后面的元素都得往后移動筹吐,然后才能進(jìn)行操作,比較麻煩富纸。
  • 單鏈表
    • 插入萌腿、刪除數(shù)據(jù)方便(直接修改節(jié)點(diǎn)指針)
    • 查詢效率低(遍歷結(jié)點(diǎn)娱挨、時間復(fù)雜度O(n))
  • 紅黑樹
    • 一種自平衡的二叉查找樹,除了符合二叉查找樹的基本特性外洋侨,還具有以下特性:
      • 二叉查找樹,左子樹元素大于右子樹倦蚪,最大的查找次數(shù)為樹高希坚。
      • 節(jié)點(diǎn)是紅色或黑色。
      • 根節(jié)點(diǎn)是黑色审丘。
      • 每個葉子節(jié)點(diǎn)都是黑色的空節(jié)點(diǎn)(NIL節(jié)點(diǎn))吏够。
      • 每個紅色節(jié)點(diǎn)的兩個子節(jié)點(diǎn)都是黑色。(從每個葉子到根的所有路徑上不能有兩個連續(xù)的紅色節(jié)點(diǎn))
      • 從任一節(jié)點(diǎn)到其每個葉子的所有路徑都包含相同數(shù)目的黑色節(jié)點(diǎn)滩报。
    • 紅黑樹的這些規(guī)則锅知,保證了紅黑樹的自平衡。
    • 但是脓钾,當(dāng)插入售睹、刪除節(jié)點(diǎn)時,這些規(guī)則可能會被打破可训,導(dǎo)致紅黑樹不再是一個紅黑樹了昌妹。這時就需要做出一些調(diào)整,調(diào)整方法有:變色握截、旋轉(zhuǎn)(左旋飞崖、右旋)。
      • 變色就是將紅色變?yōu)楹谏靼谏優(yōu)榧t色固歪,為了滿足上面的條件
        • 注意:變色會發(fā)生連鎖反應(yīng),所以要經(jīng)過多次變色胯努。
      • 左旋轉(zhuǎn)
        • 逆時針旋轉(zhuǎn)紅黑樹的兩個節(jié)點(diǎn)牢裳,使得父節(jié)點(diǎn)被自己的右孩子取代,而自己成為自己的左孩子叶沛。
      • 右旋轉(zhuǎn)
        • 順時針旋轉(zhuǎn)紅黑樹的兩個節(jié)點(diǎn)蒲讯,使得父節(jié)點(diǎn)被自己的左孩子取代,而自己成為自己的右孩子灰署。

源碼分析

  • 下文的源碼是基于 jdk1.8 版本來進(jìn)行分析的
    • 之前 jdk1.7 的存儲結(jié)構(gòu)是數(shù)組+鏈表 ( 拉鏈?zhǔn)?)判帮,到了 jdk1.8 變成了數(shù)組+鏈表+紅黑樹局嘁。
      • 不是說變成了紅黑樹效率就一定提高了,只有在鏈表的長度不小于8脊另,而且數(shù)組的長度不小于64的時候才會將鏈表轉(zhuǎn)化為紅黑樹导狡。
      • jdk1.7 版本增刪效率高,jdk1.8 版本增刪偎痛、查找效率都高旱捧。
      • jdk1.8 版本的優(yōu)化在擴(kuò)容機(jī)制的數(shù)組元素轉(zhuǎn)移的地方有很巧妙設(shè)計的體現(xiàn)。
    • 另外踩麦,HashMap 是非線程安全的枚赡,也就是說在多個線程同時對 HashMap 中的某個元素進(jìn)行增刪改操作的時候,是不能保證數(shù)據(jù)的一致性的谓谦。

數(shù)據(jù)結(jié)構(gòu)表示

  • 最終的數(shù)據(jù)結(jié)構(gòu)整體是數(shù)組贫橙,然后每個數(shù)組元素是一個鏈表的節(jié)點(diǎn)。當(dāng)發(fā)生沖突時反粥,在節(jié)點(diǎn)處使用尾插法插入節(jié)點(diǎn)卢肃。當(dāng)鏈表長度大于8之后(在數(shù)組長度大于64的前提下),鏈表就會轉(zhuǎn)換為紅黑樹了才顿。
  • 鏈表節(jié)點(diǎn)的表示:
    • 存儲了 hash 碼莫湘,Key、Value郑气、鏈表的指針域(指向下一個節(jié)點(diǎn))幅垮。
//HashMap的靜態(tài)內(nèi)部類 Node 用于表示節(jié)點(diǎn)
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {···}

        public final K getKey()        {···}
        public final V getValue()      {···}
        public final String toString() {···}

        public final int hashCode() {···}

        public final V setValue(V newValue) {···}

        public final boolean equals(Object o) {···}
    }
  • 紅黑樹的表示:
    • 存儲了 雙親結(jié)點(diǎn)、左子樹尾组、右子樹忙芒、前一個元素的節(jié)點(diǎn)、是否為紅色(布爾值)讳侨。
    • 另外由于它繼承自 LinkedHashMap.Entry 呵萨,而 LinkedHashMap.Entry 繼承自 HashMap.Node ,因此還有額外的 6 個屬性跨跨。
    static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
        
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }
        ···
    }
    
    //繼承 LinkedHashMap.Entry 的
    Entry<K,V> before, after;
 
    //HashMap.Node 的
    final int hash;
    final K key;
    V value;
    Node<K,V> next;

幾個常量潮峦、變量

  • 其中,閾值: threshold = capacity * loadFactory歹叮。
  • 注意這三個變量的區(qū)別:threshold跑杭、size铆帽、length咆耿。
  • modCount 記錄的HashMap結(jié)構(gòu)的改變是指 HashMap中的 映射數(shù) 或以 其他方式修改其 內(nèi)部結(jié)構(gòu)
    • 注意:某個key對應(yīng)的value值被覆蓋不屬于結(jié)構(gòu)變化的爹橱。
    //默認(rèn)數(shù)組容量大腥荨:16
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 
    
    //數(shù)組最大容量大姓觥:2 的 30 次方
    static final int MAXIMUM_CAPACITY = 1 << 30;
    
    //默認(rèn)的加載因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    //使用樹而不是鏈表的計數(shù)閾值,將元素添加到至少這么多的節(jié)點(diǎn)的鏈表中時慰技,鏈表將轉(zhuǎn)換為樹
    static final int TREEIFY_THRESHOLD = 8;
    
    //可以進(jìn)行樹化的最小數(shù)組容量
    static final int MIN_TREEIFY_CAPACITY = 64;
    
    //存儲鍵值對元素的數(shù)組椭盏,分配后,長度始終是 2 的冪(哈希桶數(shù)組)
    transient Node<K,V>[] table;
    
    //此映射中包含的鍵-值映射數(shù)吻商,即當(dāng)前數(shù)組中的元素數(shù)量
    transient int size;
    
    //主要用于記錄HashMap內(nèi)部結(jié)構(gòu)發(fā)生變化的次數(shù)掏颊。
    transient int modCount;
    
    //哈希表所能容納的最大鍵值對個數(shù),下次擴(kuò)容的臨界值艾帐,size>=threshold 數(shù)組就會擴(kuò)容
    int threshold;
    
    //負(fù)載因子
    final float loadFactor;

構(gòu)造方法

  • HashMap 有四個構(gòu)造方法乌叶,如下:
    /**
     * 使用默認(rèn)的初始容量(16)和默認(rèn)的加載因子(0.75)構(gòu)造一個空的 HashMap
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }
    
    public HashMap(int initialCapacity) {
         this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }
       
    /**
     * 構(gòu)造一個新的 HashMap ,其映射與指定的 Map 相同柒爸。
     * HashMap 是使用默認(rèn)負(fù)載因子(0.75)和足以將映射保存在指定的 Map 中的初始容量創(chuàng)建的
     */
    public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        putMapEntries(m, false);
    }
    
    /**
     * 構(gòu)造一個帶指定初始容量和加載因子的空 HashMap准浴。
     */
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }
  • 這里簡單的說一下構(gòu)造方法中的兩個東西

  • initialCapacity 初始容量

    • 官方要求我們要輸入一個2的N次冪的值,比如說2捎稚、4乐横、8、16等等這些今野,但是我們忽然一個不小心葡公,輸入了一個20怎么辦?沒關(guān)系腥泥,虛擬機(jī)會根據(jù)你輸入的值匾南,找一個離20最近的2的N次冪的值,比如說16離他最近蛔外,就取16為初始容量蛆楞。
  • loadFactor 負(fù)載因子

    • 默認(rèn)值是0.75。負(fù)載因子表示一個散列表的空間的使用程度夹厌,有這樣一個公式:initailCapacity*loadFactor = HashMap 的容量豹爹。
    • 所以負(fù)載因子越大則散列表的裝填程度越高,也就是能容納更多的元素矛纹,元素多了臂聋,鏈表大了,所以此時索引效率就會降低或南。反之孩等,負(fù)載因子越小則鏈表中的數(shù)據(jù)量就越稀疏,此時會對空間造成爛費(fèi)采够,但是此時索引效率高肄方。

確定哈希桶數(shù)組索引位置

  • 主要是hash算法(均勻的)。
  • jdk1.8 版本將這個過程的一部分融入到了 put() 過程中蹬癌。
  • 首先我們知道 HashMap 是根據(jù) Key 的 hashCode來確定鍵值對在哈希桶數(shù)組的位置的权她。得到了hash值之后又該怎么做呢虹茶?首先想到的是取模,當(dāng)然隅要,肯定不是這樣的蝴罪,不然人人都能當(dāng)大牛了_。其實(shí)是通過巧妙的位運(yùn)算來操作的(更高效)步清。
    • 下面就是 HashMap 中的 hash() 方法的實(shí)現(xiàn)要门。
//經(jīng)過兩步操作最后得到的才是我們用來確定位置的hash值
    static final int hash(Object key) {
        int h;
        // h = key.hashCode() 為第一步 取hashCode值
        // h ^ (h >>> 16)  為第二步 高位參與運(yùn)算
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
//確定hash值之后的操作就是確定在哈希桶中的位置了
//下面是 put() 方法中的一行代碼,n為哈希桶數(shù)組長度廓啊,hash為前一步確定的hash值
    p = tab[i = (n - 1) & hash]
  • 可以看到暂衡,哈希桶數(shù)組索引位置是由位運(yùn)算來操作。下面是一個例子
HashMap確定哈希桶數(shù)組索引位置的位移運(yùn)算舉例
  • 仔細(xì)想一下崖瞭,數(shù)組長度減一得到的值的二進(jìn)制數(shù)狂巢,前面大部分都是0,所以书聚,可以說唧领,Hash算法最終得到的index結(jié)果,完全取決于Key的Hashcode值的最后幾位雌续。
  • 那么這樣的過程是不是會出現(xiàn)不同的key得到同一個索引位置的情況呢斩个?
    • 當(dāng)計算的hash值出現(xiàn)了重復(fù),就出現(xiàn)了地址沖突了(嚴(yán)格來收叫做碰撞)
    • 這時候就需要解決沖突了驯杜。詳情請見后面小標(biāo)題——解決沖突受啥。

put 插入過程

  • 具體的流程就如下圖所示(在put過程中是解決了地址沖突的),get操作自己下去看鸽心,也是類似的滚局。
HashMap的put過程圖解
    public V put(K key, V value) {
        //這里調(diào)用了hash()方法,拿到了Key的hash值
        return putVal(hash(key), key, value, false, true);
    }
    
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //第一部分:哈希桶數(shù)組是否為空顽频,為空則使用默認(rèn)值創(chuàng)建
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //第二部分:拿到index對應(yīng)的數(shù)組元素(節(jié)點(diǎn))藤肢,判斷是否為空,為空則直接插入
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        //第三部分:節(jié)點(diǎn)存在糯景,發(fā)生哈希碰撞嘁圈,解決哈希碰撞
        else {
            Node<K,V> e; K k;
            //第三部分第一小節(jié):Key存在,則直接覆蓋Value
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            //第三部分第二小節(jié):節(jié)點(diǎn)所處的數(shù)據(jù)結(jié)構(gòu)是否為紅黑樹
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            //第三部分第三小節(jié):節(jié)點(diǎn)所處的數(shù)據(jù)結(jié)構(gòu)為鏈表蟀淮,遍歷鏈表節(jié)點(diǎn)
            else {
                for (int binCount = 0; ; ++binCount) {
                    //第三小節(jié)第一段:是否存在節(jié)點(diǎn)最住,不存在則創(chuàng)建
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        //這個時候計數(shù)閾值大于了8則轉(zhuǎn)換為紅黑樹進(jìn)行操作
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    //第三小節(jié)第二段:Key存在則直接覆蓋
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    //第三小節(jié)第三段:
                    p = e;
                }
            }
            //第三部分第四小節(jié):
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        //第四部分:鏈表中的元素數(shù)量大于閾值,則擴(kuò)容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

resize 擴(kuò)容機(jī)制

  • 不斷的向 HashMap 中添加元素怠惶,當(dāng)哈希桶數(shù)組的元素數(shù)目超過閾值涨缚,就要擴(kuò)容了。
    • 擴(kuò)容后的 HashMap 容量是之前容量的兩倍甚疟。
    • 擴(kuò)容操作十分耗時仗岖,所以在使用的時候要適當(dāng)?shù)慕o定容量值。
  • 對數(shù)組進(jìn)行擴(kuò)容览妖,數(shù)組大小是不能改變的轧拄,所以這里使用了構(gòu)建新數(shù)組,然后轉(zhuǎn)移舊數(shù)組元素的方式來實(shí)現(xiàn)的讽膏。
    • 這一點(diǎn)在 ArrayList 中也有體現(xiàn)檩电。
  • 所以,具體的流程如下:
    • 排除異常情況
    • 擴(kuò)容2倍新建數(shù)組
    • 轉(zhuǎn)移數(shù)據(jù)
    • 新數(shù)組引用到table上
    • 重新設(shè)置閾值
 final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        int oldThr = threshold;
        int newCap, newThr = 0;
        //第一部分:排除異常情況府树,擴(kuò)容
        if (oldCap > 0) {
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }
        //第二部分:設(shè)置閾值
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        //第三部分:舊數(shù)據(jù)保存在新數(shù)組里面
        if (oldTab != null) {
            //遍歷舊數(shù)組
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                     //只有一個節(jié)點(diǎn)俐末,通過索引位置直接映射
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    //如果是紅黑樹,需要進(jìn)行樹拆分然后映射
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    //如果是多個節(jié)點(diǎn)的鏈表奄侠,將原鏈表拆分為兩個鏈表
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            //原索引
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            //原索引 + oldCap
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                         //鏈表1存于原索引
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        //鏈表2存于原索引加上原h(huán)ash桶長度的偏移量
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }
  • 經(jīng)上分析之后卓箫,可以得出:在擴(kuò)容后,原數(shù)組元素被分為了兩部分:
    • 索引位置要么不變
    • 要么動舊容量個位置
  • 鏈表轉(zhuǎn)移數(shù)據(jù)的部分垄潮,分為了兩個鏈表烹卒,通過下面的語句來判斷
if ((e.hash & oldCap) == 0) {···}
  • 擴(kuò)容后,若hash值新增參與運(yùn)算的位=0弯洗,那么元素在擴(kuò)容后的位置=原始位置
  • 擴(kuò)容后旅急,若hash值新增參與運(yùn)算的位=1,那么元素在擴(kuò)容后的位置=原始位置+擴(kuò)容后的舊位置牡整。
  • hash值新增參與運(yùn)算的位是什么呢藐吮?我們把hash值轉(zhuǎn)變成二進(jìn)制數(shù)字,新增參與運(yùn)算的位就是倒數(shù)第五位逃贝。
  • 這里面有一個非常好的設(shè)計理念谣辞,擴(kuò)容后長度為原h(huán)ash表的2倍,于是把hash表分為兩半沐扳,分為低位和高位潦闲,如果能把原鏈表的鍵值對, 一半放在低位迫皱,一半放在高位歉闰,而且是通過e.hash & oldCap == 0來判斷,這個判斷有什么優(yōu)點(diǎn)呢卓起?
舉個例子:n = 16和敬,二進(jìn)制為10000,第5位為1戏阅,e.hash & oldCap 是否等于0就取決于e.hash第5 位是0還是1昼弟,這就相當(dāng)于有50%的概率放在新hash表低位,50%的概率放在新hash表高位奕筐。

線程安全性

  • 不安全舱痘!
  • 所以才會有了 ConcurrentHashMap变骡,它的功能和 HashMap 是一樣的,但它支持并發(fā)訪問芭逝。

解決沖突

  • java 中 HashMap 采用的是 鏈地址法 來解決沖突的塌碌。
  • 哈希碰撞: 在插入數(shù)據(jù)時,通過hash算法計算出來的index這個位置旬盯,在哈希桶數(shù)組上已經(jīng)存在元素台妆,則會出現(xiàn)哈希沖突(哈希碰撞更官方)。
  • 發(fā)生沖突之后會解決沖突:將數(shù)據(jù)掛在初始化位置(有點(diǎn)問題)的鏈表后(尾插法)胖翰,然后當(dāng)某個結(jié)點(diǎn)出現(xiàn)過多的鏈表結(jié)點(diǎn)之后接剩,就會轉(zhuǎn)換為紅黑樹以提高效率

學(xué)完 HashMap 原理之后,我們應(yīng)該解決的問題

HashMap的底層數(shù)據(jù)結(jié)構(gòu)是什么萨咳?

jdk1.7 及之前的版本是:數(shù)組 + 鏈表
jdk1.8 版本是:數(shù)組 + 鏈表 + 紅黑樹

為什么是紅黑樹呢懊缺?

紅黑樹是一個自平衡的二叉查找樹,也就是說紅黑樹的查找效率是非常的高培他,查找效率會從鏈表的o(n)降低為o(logn)桐汤。

為什么不一下子把整個鏈表變?yōu)榧t黑樹呢?

1. 構(gòu)造紅黑樹要比構(gòu)造鏈表復(fù)雜靶壮,在鏈表的節(jié)點(diǎn)不多的時候怔毛,從整體的性能看來, 數(shù)組+鏈表+紅黑樹的結(jié)構(gòu)可能不一定比數(shù)組+鏈表的結(jié)構(gòu)性能高腾降。

2. HashMap 頻繁的擴(kuò)容拣度,會造成底部紅黑樹不斷的進(jìn)行拆分和重組,這是非常耗時的螃壤。因此抗果,也就是鏈表長度比較長的時候轉(zhuǎn)變成紅黑樹才會顯著提高效率。

HashMap中增刪改查操作的底部實(shí)現(xiàn)原理是什么奸晴?

太多了冤馏,自己想想put過程、數(shù)據(jù)結(jié)構(gòu)等

為什么HashMap容量一定要為16或者2的冪呢寄啼?

HashMap 采用這種非常規(guī)設(shè)計逮光,主要是為了在取模和擴(kuò)容時做優(yōu)化,同時為了減少hash碰撞墩划,HashMap 定位哈希桶索引位置時涕刚,也加入了高位參與運(yùn)算的過程。

長度16或者其他2的冪乙帮,Length-1的值是所有二進(jìn)制位全為1杜漠,這種情況下,index的結(jié)果等同于HashCode后幾位的值。只要輸入的HashCode本身分布均勻驾茴,Hash算法的結(jié)果就是均勻的盼樟。

如果不為16或者2的冪,那么锈至,經(jīng)過hash算法之后晨缴,有些index結(jié)果出現(xiàn)的概率會更大,而有些index則永遠(yuǎn)步會出現(xiàn)裹赴。即不符合hash算法的j均勻分布的原則。

為什么負(fù)載因子默認(rèn)值會是0.75呢诀浪?

在HashMap的源碼中有這樣一段注解:
     * Because TreeNodes are about twice the size of regular nodes, we
     * use them only when bins contain enough nodes to warrant use
     * (see TREEIFY_THRESHOLD). And when they become too small (due to
     * removal or resizing) they are converted back to plain bins.  In
     * usages with well-distributed user hashCodes, tree bins are
     * rarely used.  Ideally, under random hashCodes, the frequency of
     * nodes in bins follows a Poisson distribution
     * (http://en.wikipedia.org/wiki/Poisson_distribution) with a
     * parameter of about 0.5 on average for the default resizing
     * threshold of 0.75, although with a large variance because of
     * resizing granularity. Ignoring variance, the expected
     * occurrences of list size k are (exp(-0.5) * pow(0.5, k) /
     * factorial(k)). The first values are:
     *
     * 0:    0.60653066
     * 1:    0.30326533
     * 2:    0.07581633
     * 3:    0.01263606
     * 4:    0.00157952
     * 5:    0.00015795
     * 6:    0.00001316
     * 7:    0.00000094
     * 8:    0.00000006
     * more: less than 1 in ten million
     *
大概意思就是:在理想情況下棋返,使用隨機(jī)哈希嗎,節(jié)點(diǎn)出現(xiàn)的頻率在hash桶中遵循泊松分布雷猪,同時給出了桶中元素的個數(shù)和概率的對照表睛竣。

從上表可以看出當(dāng)桶中元素到達(dá)8個的時候,概率已經(jīng)變得非常小求摇,也就是說用0.75作為負(fù)載因子射沟,每個碰撞位置的鏈表長度超過8個是幾乎不可能的。
hash容器指定初始容量盡量為2的冪次方与境。
HashMap負(fù)載因子為0.75是空間和時間成本的一種折中验夯。

HashMap是如何實(shí)現(xiàn)擴(kuò)容的?

結(jié)合resize擴(kuò)容過程思考摔刁,注意轉(zhuǎn)移數(shù)據(jù)的時候是兩個鏈表(hash表高低位)挥转。

HashMap是如何解決hash沖突的?

鏈地址法9睬0笠ァ!
哈希桶數(shù)組元素發(fā)生哈希碰撞拗引,產(chǎn)生鏈表借宵,鏈表長度不小于8(數(shù)組大小不小于64),轉(zhuǎn)換為鏈表矾削。

HashMap為什么是非線程安全的壤玫?

  • HashMap不是線程安全的,在多線程并發(fā)的環(huán)境下哼凯,可能會產(chǎn)生死鎖等問題垦细。
  • 補(bǔ)充一點(diǎn) Hashtable 是線程安全的。還有并發(fā)的 HashMap :ConcurrentHashMap(java5引入的)挡逼。
因?yàn)樵创a里面方法全部都是非線程安全的呀括改。
可以將 HashMap 轉(zhuǎn)變?yōu)榫€程安全的:

HashMap<Integer, String> hashMap1 = (HashMap<Integer, String>) Collections.synchronizedMap(hashMap);

HashMap 與 Hashtable 的區(qū)別?

  • Hashtable 是java的遺留類,java4的時候被重寫了嘱能,加入了集合類吝梅。
1. HashMap線程不安全,是非synchronized的惹骂,Hashtable是線程安全的苏携。

2. HashMap可以接受null(HashMap可以接受為null的鍵值(key)和值(value)),而Hashtable則不行对粪。

3. 是HashMap的迭代器(Iterator)是fail-fast迭代器右冻,而Hashtable的enumerator迭代器不是fail-fast的。所以當(dāng)有其它線程改變了HashMap的結(jié)構(gòu)(增加或者移除元素)著拭,將會拋出ConcurrentModificationException纱扭,但迭代器本身的remove()方法移除元素則不會拋出ConcurrentModificationException異常。但這并不是一個一定發(fā)生的行為儡遮,要看JVM乳蛾。這條同樣也是Enumeration和Iterator的區(qū)別。

4. 由于Hashtable是線程安全的也是synchronized鄙币,所以在單線程環(huán)境下它比HashMap要慢肃叶。如果你不需要同步,只需要單一線程十嘿,那么使用HashMap性能要好過Hashtable因惭。

5. HashMap不能保證隨著時間的推移Map中的元素次序是不變的。

6. 繼承的父類不同绩衷、作者不同筛欢,產(chǎn)生時間不同。HashMap是繼承自AbstractMap類唇聘,而HashTable是繼承自Dictionary類版姑。不過它們都實(shí)現(xiàn)了同時實(shí)現(xiàn)了Map、Cloneable(可復(fù)制)迟郎、Serializable(可序列化)這三個接口

7. 初始容量大小和每次擴(kuò)充容量大小的不同剥险。Hashtable默認(rèn)的初始大小為11,之后每次擴(kuò)充宪肖,容量變?yōu)樵瓉淼?n+1表制。HashMap默認(rèn)的初始化大小為16。之后每次擴(kuò)充控乾,容量變?yōu)樵瓉淼?倍么介。

8. 計算hash值的方法不同。為了得到元素的位置蜕衡,首先需要根據(jù)元素的Key計算出一個hash值壤短,然后再用這個hash值來計算得到最終的位置。Hashtable直接使用對象的hashCode。然后再使用取余來獲得最終的位置久脯,比較耗時纳胧。HashMap是通過位運(yùn)算來進(jìn)行操作的,效率高帘撰。
    下面是 Hashtable 的確定索引方法:
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;

該怎么設(shè)置HashMap的閾值和負(fù)載因子呢跑慕?

個人認(rèn)為,不需要設(shè)置摧找。只需要設(shè)置好數(shù)組容量大小就好了核行。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蹬耘,隨后出現(xiàn)的幾起案子芝雪,更是在濱河造成了極大的恐慌,老刑警劉巖婆赠,帶你破解...
    沈念sama閱讀 207,248評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件绵脯,死亡現(xiàn)場離奇詭異佳励,居然都是意外死亡休里,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評論 2 381
  • 文/潘曉璐 我一進(jìn)店門赃承,熙熙樓的掌柜王于貴愁眉苦臉地迎上來妙黍,“玉大人,你說我怎么就攤上這事瞧剖∈眉蓿” “怎么了?”我有些...
    開封第一講書人閱讀 153,443評論 0 344
  • 文/不壞的土叔 我叫張陵抓于,是天一觀的道長做粤。 經(jīng)常有香客問我,道長捉撮,這世上最難降的妖魔是什么怕品? 我笑而不...
    開封第一講書人閱讀 55,475評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮巾遭,結(jié)果婚禮上肉康,老公的妹妹穿的比我還像新娘。我一直安慰自己灼舍,他們只是感情好吼和,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著骑素,像睡著了一般狡汉。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上屹蚊,一...
    開封第一講書人閱讀 49,185評論 1 284
  • 那天,我揣著相機(jī)與錄音光督,去河邊找鬼。 笑死塔粒,一個胖子當(dāng)著我的面吹牛结借,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播卒茬,決...
    沈念sama閱讀 38,451評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼船老,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了圃酵?” 一聲冷哼從身側(cè)響起柳畔,我...
    開封第一講書人閱讀 37,112評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎郭赐,沒想到半個月后薪韩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,609評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡捌锭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評論 2 325
  • 正文 我和宋清朗相戀三年俘陷,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片观谦。...
    茶點(diǎn)故事閱讀 38,163評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡拉盾,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出豁状,到底是詐尸還是另有隱情捉偏,我是刑警寧澤,帶...
    沈念sama閱讀 33,803評論 4 323
  • 正文 年R本政府宣布泻红,位于F島的核電站夭禽,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏谊路。R本人自食惡果不足惜讹躯,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望凶异。 院中可真熱鬧蜀撑,春花似錦、人聲如沸剩彬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽喉恋。三九已至沃饶,卻和暖如春母廷,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背糊肤。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評論 1 261
  • 我被黑心中介騙來泰國打工琴昆, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人馆揉。 一個月前我還...
    沈念sama閱讀 45,636評論 2 355
  • 正文 我出身青樓业舍,卻偏偏與公主長得像,于是被迫代替她去往敵國和親升酣。 傳聞我的和親對象是個殘疾皇子舷暮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評論 2 344