Jdk1.8 HashMap源碼分析

1. 概述

平常我們開發(fā)中徒仓,可能用的最多的容器就是HashMap。我們來看下HashMap的結構如下圖。


image.png

它是由一個Node數組,每個數組元素又是有一個鏈表構成。接下來我們結合源碼來分析下put(),get(),resize()者三個常見的操作。

2. 類成員變量的認識
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // HashMap初始的bucket16.必須是2的n次冪雷滋,原因在后面會涉及到

static final int MAXIMUM_CAPACITY = 1 << 30;  //最大容量

static final float DEFAULT_LOAD_FACTOR = 0.75f; //負載因子,估計整個bucket沖突实愚,當到達bucket*0.75容量時维苔,會引起擴容

static final int TREEIFY_THRESHOLD = 8;  //當鏈表長度大于這個值時,會轉變成紅黑樹

static final int UNTREEIFY_THRESHOLD = 6; //當樹的節(jié)點低于這個值時會轉變成鏈表

3. put()函數的解析

put()添加操作的過程如下胁出。

  • 對key的hashCode()做hash寺枉,然后再計算index(求余);
  • 如果沒碰撞直接放到bucket里;
  • 如果碰撞了催式,以鏈表的形式存在buckets后槐脏;
  • 如果碰撞導致鏈表過長(大于等于TREEIFY_THRESHOLD),就把鏈表轉換成紅黑樹;
  • 如果節(jié)點已經存在就替換old value(保證key的唯一性)
  • 如果bucket滿了(超過load factor*current capacity)晶框,就要resize侵贵。
    其他的解釋都在源碼中標注。
public V put(K key, V value) {
        //對key的hashcode做hash
        return putVal(hash(key), key, value, false, true);
    }
//onlyIfAbsent為true時,相同的key不會改變替換值。這里的為false补胚,會替換
//evict表示模式瓶逃,為fasle表示處于bucket處于創(chuàng)建階段契沫。這里用true指創(chuàng)建完了会通。
 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            //若為null,則創(chuàng)建bucket
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            //若bucket那個位置為null,則創(chuàng)建新的Node節(jié)點
            tab[i] = newNode(hash, key, value, null);
            //表示bucket不為null
        else {
            Node<K,V> e; K k;
            //key存在
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
                //若原來為TreeNode,則插入到紅黑樹種中
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                //若原來為鏈表
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //寫入调违,若原來有值虚婿,則替換
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        //若超過當前容量大小超過capacity*0.75剧浸,則會引起擴容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

注意這里采用的二次hash()操作,不是直接對hashcode再hash。

//hashcode的低16位和高16位做
異或操作
static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
  • 之所以這樣hash倘待,是采用key的hashcode的低16位和高16位做異或操作啊奄。這樣的好處在于避免hash沖突胧辽。否則人断,它只取低16位暇仲,與高位無關斥滤,那么它有可能會hash沖突嚴重。另外凸克,如果還有更嚴重的沖突蚂维,那么可以采用紅黑樹來解決,事實上Jdk1.8 HashMap也是采用的這樣的思想。

Improve the performance of java.util.HashMap under high hash-collision conditions by using balanced trees rather than linked lists to store map entries. Implement the same improvement in the LinkedHashMap class.

4. get()的解析

get()相對來說就非常簡單了斤吐,過程如下臼婆。

  • bucket里的第一個節(jié)點颁独,直接命中寨辩;
  • 如果有沖突,則通過key.equals(k)去查找對應的entry
  • 若為樹,則在樹中通過key.equals(k)查找缸榛,O(logn)均澳;
  • 若為鏈表,則在鏈表中通過key.equals(k)查找辩撑,O(n)开缎。
public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        //這個if判斷bucket是否存在
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            //檢查第一個Node(bucket中第一個節(jié)點)是否是要查找的侮邀。
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                //紅黑樹的查找key
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                //遍歷鏈表鹏秋,尋找key相同
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

(n - 1) & hash就是一個求索引衙传,即求Node數組中的下標。這樣的操作是,當我們的n(表示capacity時)取2的冪的時候购公,例如n取16,那么n-1=15(二進制表示1111)與hash做與操作的時候相當于取余,這樣做比直接取余更高效鹃唯。

5. reSize()的解析
  • 當put時,如果發(fā)現(xiàn)目前的bucket占用程度已經超過了Load Factor所希望的比例絮爷,那么就會發(fā)生resize岖寞。在resize的過程仗谆,簡單的說就是把bucket擴充為2倍狸吞,之后重新計算index威始,把節(jié)點再放到新的bucket中。
  • 然而又因為我們使用的是2次冪的擴展(指長度擴為原來2倍)星立,所以葬凳,元素的位置要么是在原位置绰垂,要么是在(原位置+舊capacity)的位置。
    怎么理解呢火焰?例如我們從16擴展為32時屏富,具體的變化如下所示:


    rehash
  • 這個設計確實非常的巧妙饥追,既省去了重新計算hash值的時間,而且同時,由于新增的1bit是0還是1可以認為是隨機的垛耳,因此resize的過程蓝牲,均勻的把之前的沖突的節(jié)點分散到新的bucket了傅蹂。因此元素在重新計算hash之后励稳,因為n變?yōu)?倍,那么n-1的mask范圍在高位多1bit(紅色)犬金,因此新的index就會發(fā)生這樣的變化:


    resize

因此念恍,我們在擴充HashMap的時候碎紊,不需要重新計算hash,只需要看看原來的hash值新增的那個bit是1還是0就好了樊诺,是0的話索引沒變仗考,是1的話索引變成“原索引+oldCap”〈逝溃可以看看下圖為16擴充為32的resize示意圖:


resize16-32
final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        int oldThr = threshold;
        int newCap, newThr = 0;
        if (oldCap > 0) {
          //舊的hashMap容量已經達到最大值秃嗜,那么最新的也只能是最大值
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
        //如果原來存在舊的容量存在,那么新分配的就是舊的兩倍
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }
//舊的容量oldThreshold已經存在顿膨,但是沒分配容量锅锨。那么久新的容量=oldThreshold
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
   //兩個變量都沒有初始化
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
//如果初始化的oldThreshold為0,則重新取整
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                  //尾插法把節(jié)點插入新分配的bucket中恋沃。不帶頭節(jié)點的
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

參考文章:

  1. Java HashMap工作原理及實現(xiàn)
  2. HashMap1.8源碼解讀
  3. 深入淺出ConcurrentHashMap1.8
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末必搞,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子囊咏,更是在濱河造成了極大的恐慌恕洲,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件梅割,死亡現(xiàn)場離奇詭異霜第,居然都是意外死亡,警方通過查閱死者的電腦和手機户辞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進店門泌类,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人底燎,你說我怎么就攤上這事刃榨。” “怎么了双仍?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵枢希,是天一觀的道長。 經常有香客問我殊校,道長晴玖,這世上最難降的妖魔是什么读存? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任为流,我火速辦了婚禮,結果婚禮上让簿,老公的妹妹穿的比我還像新娘敬察。我一直安慰自己,他們只是感情好尔当,可當我...
    茶點故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布莲祸。 她就那樣靜靜地躺著蹂安,像睡著了一般。 火紅的嫁衣襯著肌膚如雪锐帜。 梳的紋絲不亂的頭發(fā)上田盈,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天,我揣著相機與錄音缴阎,去河邊找鬼允瞧。 笑死,一個胖子當著我的面吹牛蛮拔,可吹牛的內容都是我干的述暂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼建炫,長吁一口氣:“原來是場噩夢啊……” “哼畦韭!你這毒婦竟也來了?” 一聲冷哼從身側響起肛跌,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤艺配,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后衍慎,有當地人在樹林里發(fā)現(xiàn)了一具尸體妒挎,經...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年西饵,在試婚紗的時候發(fā)現(xiàn)自己被綠了酝掩。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡眷柔,死狀恐怖期虾,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情驯嘱,我是刑警寧澤镶苞,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站鞠评,受9級特大地震影響茂蚓,放射性物質發(fā)生泄漏。R本人自食惡果不足惜剃幌,卻給世界環(huán)境...
    茶點故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一聋涨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧负乡,春花似錦牍白、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽狸涌。三九已至,卻和暖如春最岗,著一層夾襖步出監(jiān)牢的瞬間帕胆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工般渡, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留惶楼,地道東北人。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓诊杆,卻偏偏與公主長得像歼捐,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子晨汹,可洞房花燭夜當晚...
    茶點故事閱讀 45,066評論 2 355

推薦閱讀更多精彩內容