Java7_8 中的 HashMap 和 ConcurrentHashMap 全解析

原文出處 javadoop

今天發(fā)一篇"水文"裳食,可能很多讀者都會(huì)表示不理解骂际,不過(guò)我想把它作為并發(fā)序列文章中不可缺少的一塊來(lái)介紹豹绪。本來(lái)以為花不了多少時(shí)間的墅拭,不過(guò)最終還是投入了挺多時(shí)間來(lái)完成這篇文章的淤齐。

網(wǎng)上關(guān)于 HashMap 和 ConcurrentHashMap 的文章確實(shí)不少股囊,不過(guò)缺斤少兩的文章比較多,所以才想自己也寫(xiě)一篇更啄,把細(xì)節(jié)說(shuō)清楚說(shuō)透稚疹,尤其像 Java8 中的 ConcurrentHashMap,大部分文章都說(shuō)不清楚祭务。終歸是希望能降低大家學(xué)習(xí)的成本内狗,不希望大家到處找各種不是很靠譜的文章,看完一篇又一篇义锥,可是還是模模糊糊柳沙。

閱讀建議:四節(jié)基本上可以進(jìn)行獨(dú)立閱讀,建議初學(xué)者可按照 Java7 HashMap -> Java7 ConcurrentHashMap -> Java8 HashMap -> Java8 ConcurrentHashMap 順序進(jìn)行閱讀缨该,可適當(dāng)降低閱讀門(mén)檻偎行。

閱讀前提:本文分析的是源碼肋拔,所以至少讀者要熟悉它們的接口使用烹俗,同時(shí),對(duì)于并發(fā)塌衰,讀者至少要知道 CAS膨更、ReentrantLock妙真、UNSAFE 操作這幾個(gè)基本的知識(shí),文中不會(huì)對(duì)這些知識(shí)進(jìn)行介紹荚守。Java8 用到了紅黑樹(shù)珍德,不過(guò)本文不會(huì)進(jìn)行展開(kāi),感興趣的讀者請(qǐng)自行查找相關(guān)資料矗漾。

Java7 HashMap

HashMap 是最簡(jiǎn)單的锈候,一來(lái)我們非常熟悉,二來(lái)就是它不支持并發(fā)操作敞贡,所以源碼也非常簡(jiǎn)單泵琳。

首先,我們用下面這張圖來(lái)介紹 HashMap 的結(jié)構(gòu)誊役。

1

這個(gè)僅僅是示意圖获列,因?yàn)闆](méi)有考慮到數(shù)組要擴(kuò)容的情況,具體的后面再說(shuō)蛔垢。

大方向上击孩,HashMap 里面是一個(gè)數(shù)組,然后數(shù)組中每個(gè)元素是一個(gè)單向鏈表鹏漆。

上圖中巩梢,每個(gè)綠色的實(shí)體是嵌套類(lèi) Entry 的實(shí)例创泄,Entry 包含四個(gè)屬性:key, value, hash 值和用于單向鏈表的 next。

capacity:當(dāng)前數(shù)組容量且改,始終保持 2^n验烧,可以擴(kuò)容,擴(kuò)容后數(shù)組大小為當(dāng)前的 2 倍又跛。

loadFactor:負(fù)載因子碍拆,默認(rèn)為 0.75。

threshold:擴(kuò)容的閾值慨蓝,等于 capacity * loadFactor

put 過(guò)程分析

還是比較簡(jiǎn)單的感混,跟著代碼走一遍吧。

public V put(K key, V value) {
    // 當(dāng)插入第一個(gè)元素的時(shí)候礼烈,需要先初始化數(shù)組大小
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    // 如果 key 為 null弧满,感興趣的可以往里看,最終會(huì)將這個(gè) entry 放到 table[0] 中
    if (key == null)
        return putForNullKey(value);
    // 1. 求 key 的 hash 值
    int hash = hash(key);
    // 2. 找到對(duì)應(yīng)的數(shù)組下標(biāo)
    int i = indexFor(hash, table.length);
    // 3. 遍歷一下對(duì)應(yīng)下標(biāo)處的鏈表此熬,看是否有重復(fù)的 key 已經(jīng)存在庭呜,
    //    如果有,直接覆蓋犀忱,put 方法返回舊值就結(jié)束了
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    // 4. 不存在重復(fù)的 key募谎,將此 entry 添加到鏈表中,細(xì)節(jié)后面說(shuō)
    addEntry(hash, key, value, i);
    return null;
}

數(shù)組初始化

在第一個(gè)元素插入 HashMap 的時(shí)候做一次數(shù)組的初始化阴汇,就是先確定初始的數(shù)組大小数冬,并計(jì)算數(shù)組擴(kuò)容的閾值。

private void inflateTable(int toSize) {
    // 保證數(shù)組大小一定是 2 的 n 次方搀庶。
    // 比如這樣初始化:new HashMap(20)拐纱,那么處理成初始數(shù)組大小是 32
    int capacity = roundUpToPowerOf2(toSize);
    // 計(jì)算擴(kuò)容閾值:capacity * loadFactor
    threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
    // 算是初始化數(shù)組吧
    table = new Entry[capacity];
    initHashSeedAsNeeded(capacity); //ignore
}

這里有一個(gè)將數(shù)組大小保持為 2 的 n 次方的做法,Java7 和 Java8 的 HashMap 和 ConcurrentHashMap 都有相應(yīng)的要求哥倔,只不過(guò)實(shí)現(xiàn)的代碼稍微有些不同秸架,后面再看到的時(shí)候就知道了。

計(jì)算具體數(shù)組位置

這個(gè)簡(jiǎn)單咆蒿,我們自己也能 YY 一個(gè):使用 key 的 hash 值對(duì)數(shù)組長(zhǎng)度進(jìn)行取模就可以了东抹。

static int indexFor(int hash, int length) {
    // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
    return hash & (length-1);
}

這個(gè)方法很簡(jiǎn)單,簡(jiǎn)單說(shuō)就是取 hash 值的低 n 位蜡秽。如在數(shù)組長(zhǎng)度為 32 的時(shí)候府阀,其實(shí)取的就是 key 的 hash 值的低 5 位缆镣,作為它在數(shù)組中的下標(biāo)位置芽突。

添加節(jié)點(diǎn)到鏈表中

找到數(shù)組下標(biāo)后,會(huì)先進(jìn)行 key 判重董瞻,如果沒(méi)有重復(fù)寞蚌,就準(zhǔn)備將新值放入到鏈表的表頭田巴。

void addEntry(int hash, K key, V value, int bucketIndex) {
    // 如果當(dāng)前 HashMap 大小已經(jīng)達(dá)到了閾值,并且新值要插入的數(shù)組位置已經(jīng)有元素了挟秤,那么要擴(kuò)容
    if ((size >= threshold) && (null != table[bucketIndex])) {
        // 擴(kuò)容壹哺,后面會(huì)介紹一下
        resize(2 * table.length);
        // 擴(kuò)容以后,重新計(jì)算 hash 值
        hash = (null != key) ? hash(key) : 0;
        // 重新計(jì)算擴(kuò)容后的新的下標(biāo)
        bucketIndex = indexFor(hash, table.length);
    }
    // 往下看
    createEntry(hash, key, value, bucketIndex);
}
// 這個(gè)很簡(jiǎn)單艘刚,其實(shí)就是將新值放到鏈表的表頭管宵,然后 size++
void createEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
    table[bucketIndex] = new Entry<>(hash, key, value, e);
    size++;
}

這個(gè)方法的主要邏輯就是先判斷是否需要擴(kuò)容,需要的話(huà)先擴(kuò)容攀甚,然后再將這個(gè)新的數(shù)據(jù)插入到擴(kuò)容后的數(shù)組的相應(yīng)位置處的鏈表的表頭箩朴。

數(shù)組擴(kuò)容

前面我們看到,在插入新值的時(shí)候秋度,如果當(dāng)前的 size 已經(jīng)達(dá)到了閾值炸庞,并且要插入的數(shù)組位置上已經(jīng)有元素,那么就會(huì)觸發(fā)擴(kuò)容荚斯,擴(kuò)容后埠居,數(shù)組大小為原來(lái)的 2 倍。

void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    if (oldCapacity == MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return;
    }
    // 新的數(shù)組
    Entry[] newTable = new Entry[newCapacity];
    // 將原來(lái)數(shù)組中的值遷移到新的更大的數(shù)組中
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    table = newTable;
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}

擴(kuò)容就是用一個(gè)新的大數(shù)組替換原來(lái)的小數(shù)組事期,并將原來(lái)數(shù)組中的值遷移到新的數(shù)組中滥壕。

由于是雙倍擴(kuò)容,遷移過(guò)程中刑赶,會(huì)將原來(lái) table[i] 中的鏈表的所有節(jié)點(diǎn)捏浊,分拆到新的數(shù)組的 newTable[i] 和 newTable[i + oldLength] 位置上。如原來(lái)數(shù)組長(zhǎng)度是 16撞叨,那么擴(kuò)容后金踪,原來(lái) table[0] 處的鏈表中的所有元素會(huì)被分配到新數(shù)組中 newTable[0] 和 newTable[16] 這兩個(gè)位置。代碼比較簡(jiǎn)單牵敷,這里就不展開(kāi)了胡岔。

get 過(guò)程分析

相對(duì)于 put 過(guò)程,get 過(guò)程是非常簡(jiǎn)單的枷餐。

  1. 根據(jù) key 計(jì)算 hash 值靶瘸。
  2. 找到相應(yīng)的數(shù)組下標(biāo):hash & (length - 1)。
  3. 遍歷該數(shù)組位置處的鏈表毛肋,直到找到相等(==或equals)的 key怨咪。
public V get(Object key) {
    // 之前說(shuō)過(guò),key 為 null 的話(huà)润匙,會(huì)被放到 table[0]诗眨,所以只要遍歷下 table[0] 處的鏈表就可以了
    if (key == null)
        return getForNullKey();
    // 
    Entry<K,V> entry = getEntry(key);

    return null == entry ? null : entry.getValue();
}

getEntry(key):

final Entry<K,V> getEntry(Object key) {
    if (size == 0) {
        return null;
    }

    int hash = (key == null) ? 0 : hash(key);
    // 確定數(shù)組下標(biāo),然后從頭開(kāi)始遍歷鏈表孕讳,直到找到為止
    for (Entry<K,V> e = table[indexFor(hash, table.length)];
         e != null;
         e = e.next) {
        Object k;
        if (e.hash == hash &&
            ((k = e.key) == key || (key != null && key.equals(k))))
            return e;
    }
    return null;
}

Java7 ConcurrentHashMap

ConcurrentHashMap 和 HashMap 思路是差不多的匠楚,但是因?yàn)樗С植l(fā)操作巍膘,所以要復(fù)雜一些。

整個(gè) ConcurrentHashMap 由一個(gè)個(gè) Segment 組成芋簿,Segment 代表”部分“或”一段“的意思峡懈,所以很多地方都會(huì)將其描述為分段鎖。注意与斤,行文中肪康,我很多地方用了“”來(lái)代表一個(gè) segment。

簡(jiǎn)單理解就是撩穿,ConcurrentHashMap 是一個(gè) Segment 數(shù)組梅鹦,Segment 通過(guò)繼承 ReentrantLock 來(lái)進(jìn)行加鎖,所以每次需要加鎖的操作鎖住的是一個(gè) segment冗锁,這樣只要保證每個(gè) Segment 是線(xiàn)程安全的齐唆,也就實(shí)現(xiàn)了全局的線(xiàn)程安全。

3

concurrencyLevel:并行級(jí)別冻河、并發(fā)數(shù)箍邮、Segment 數(shù),怎么翻譯不重要叨叙,理解它锭弊。默認(rèn)是 16,也就是說(shuō) ConcurrentHashMap 有 16 個(gè) Segments擂错,所以理論上味滞,這個(gè)時(shí)候,最多可以同時(shí)支持 16 個(gè)線(xiàn)程并發(fā)寫(xiě)钮呀,只要它們的操作分別分布在不同的 Segment 上剑鞍。這個(gè)值可以在初始化的時(shí)候設(shè)置為其他值,但是一旦初始化以后爽醋,它是不可以擴(kuò)容的蚁署。

再具體到每個(gè) Segment 內(nèi)部,其實(shí)每個(gè) Segment 很像之前介紹的 HashMap蚂四,不過(guò)它要保證線(xiàn)程安全光戈,所以處理起來(lái)要麻煩些。

初始化

initialCapacity:初始容量遂赠,這個(gè)值指的是整個(gè) ConcurrentHashMap 的初始容量久妆,實(shí)際操作的時(shí)候需要平均分給每個(gè) Segment。

loadFactor:負(fù)載因子跷睦,之前我們說(shuō)了筷弦,Segment 數(shù)組不可以擴(kuò)容,所以這個(gè)負(fù)載因子是給每個(gè) Segment 內(nèi)部使用的送讲。

public ConcurrentHashMap(int initialCapacity,
                         float loadFactor, int concurrencyLevel) {
    if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0)
        throw new IllegalArgumentException();
    if (concurrencyLevel > MAX_SEGMENTS)
        concurrencyLevel = MAX_SEGMENTS;
    // Find power-of-two sizes best matching arguments
    int sshift = 0;
    int ssize = 1;
    // 計(jì)算并行級(jí)別 ssize奸笤,因?yàn)橐3植⑿屑?jí)別是 2 的 n 次方
    while (ssize < concurrencyLevel) {
        ++sshift;
        ssize <<= 1;
    }
    // 我們這里先不要那么燒腦,用默認(rèn)值哼鬓,concurrencyLevel 為 16监右,sshift 為 4
    // 那么計(jì)算出 segmentShift 為 28,segmentMask 為 15异希,后面會(huì)用到這兩個(gè)值
    this.segmentShift = 32 - sshift;
    this.segmentMask = ssize - 1;
  
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
  
    // initialCapacity 是設(shè)置整個(gè) map 初始的大小健盒,
    // 這里根據(jù) initialCapacity 計(jì)算 Segment 數(shù)組中每個(gè)位置可以分到的大小
    // 如 initialCapacity 為 64,那么每個(gè) Segment 或稱(chēng)之為"槽"可以分到 4 個(gè)
    int c = initialCapacity / ssize;
    if (c * ssize < initialCapacity)
        ++c;
    // 默認(rèn) MIN_SEGMENT_TABLE_CAPACITY 是 2称簿,這個(gè)值也是有講究的扣癣,因?yàn)檫@樣的話(huà),對(duì)于具體的槽上憨降,
    // 插入一個(gè)元素不至于擴(kuò)容父虑,插入第二個(gè)的時(shí)候才會(huì)擴(kuò)容
    int cap = MIN_SEGMENT_TABLE_CAPACITY; 
    while (cap < c)
        cap <<= 1;

    // 創(chuàng)建 Segment 數(shù)組,
    // 并創(chuàng)建數(shù)組的第一個(gè)元素 segment[0]
    Segment<K,V> s0 =
        new Segment<K,V>(loadFactor, (int)(cap * loadFactor),
                         (HashEntry<K,V>[])new HashEntry[cap]);
    Segment<K,V>[] ss = (Segment<K,V>[])new Segment[ssize];
    // 往數(shù)組寫(xiě)入 segment[0]
    UNSAFE.putOrderedObject(ss, SBASE, s0); // ordered write of segments[0]
    this.segments = ss;
}

初始化完成授药,我們得到了一個(gè) Segment 數(shù)組士嚎。

我們就當(dāng)是用 new ConcurrentHashMap() 無(wú)參構(gòu)造函數(shù)進(jìn)行初始化的,那么初始化完成后:

  • Segment 數(shù)組長(zhǎng)度為 16悔叽,不可以擴(kuò)容
  • Segment[i] 的默認(rèn)大小為 2莱衩,負(fù)載因子是 0.75,得出初始閾值為 1.5娇澎,也就是以后插入第一個(gè)元素不會(huì)觸發(fā)擴(kuò)容笨蚁,插入第二個(gè)會(huì)進(jìn)行第一次擴(kuò)容
  • 這里初始化了 segment[0],其他位置還是 null趟庄,至于為什么要初始化 segment[0]括细,后面的代碼會(huì)介紹
  • 當(dāng)前 segmentShift 的值為 32 - 4 = 28,segmentMask 為 16 - 1 = 15戚啥,姑且把它們簡(jiǎn)單翻譯為移位數(shù)掩碼勒极,這兩個(gè)值馬上就會(huì)用到

put 過(guò)程分析

我們先看 put 的主流程,對(duì)于其中的一些關(guān)鍵細(xì)節(jié)操作虑鼎,后面會(huì)進(jìn)行詳細(xì)介紹辱匿。

public V put(K key, V value) {
    Segment<K,V> s;
    if (value == null)
        throw new NullPointerException();
    // 1. 計(jì)算 key 的 hash 值
    int hash = hash(key);
    // 2. 根據(jù) hash 值找到 Segment 數(shù)組中的位置 j
    //    hash 是 32 位,無(wú)符號(hào)右移 segmentShift(28) 位炫彩,剩下高 4 位匾七,
    //    然后和 segmentMask(15) 做一次與操作,也就是說(shuō) j 是 hash 值的高 4 位江兢,也就是槽的數(shù)組下標(biāo)
    int j = (hash >>> segmentShift) & segmentMask;
    // 剛剛說(shuō)了昨忆,初始化的時(shí)候初始化了 segment[0],但是其他位置還是 null杉允,
    // ensureSegment(j) 對(duì) segment[j] 進(jìn)行初始化
    if ((s = (Segment<K,V>)UNSAFE.getObject          // nonvolatile; recheck
         (segments, (j << SSHIFT) + SBASE)) == null) //  in ensureSegment
        s = ensureSegment(j);
    // 3. 插入新值到 槽 s 中
    return s.put(key, hash, value, false);
}

第一層皮很簡(jiǎn)單邑贴,根據(jù) hash 值很快就能找到相應(yīng)的 Segment席里,之后就是 Segment 內(nèi)部的 put 操作了。

Segment 內(nèi)部是由 數(shù)組+鏈表 組成的拢驾。

final V put(K key, int hash, V value, boolean onlyIfAbsent) {
    // 在往該 segment 寫(xiě)入前奖磁,需要先獲取該 segment 的獨(dú)占鎖
    //    先看主流程,后面還會(huì)具體介紹這部分內(nèi)容
    HashEntry<K,V> node = tryLock() ? null :
        scanAndLockForPut(key, hash, value);
    V oldValue;
    try {
        // 這個(gè)是 segment 內(nèi)部的數(shù)組
        HashEntry<K,V>[] tab = table;
        // 再利用 hash 值繁疤,求應(yīng)該放置的數(shù)組下標(biāo)
        int index = (tab.length - 1) & hash;
        // first 是數(shù)組該位置處的鏈表的表頭
        HashEntry<K,V> first = entryAt(tab, index);
        
        // 下面這串 for 循環(huán)雖然很長(zhǎng)咖为,不過(guò)也很好理解,想想該位置沒(méi)有任何元素和已經(jīng)存在一個(gè)鏈表這兩種情況
        for (HashEntry<K,V> e = first;;) {
            if (e != null) {
                K k;
                if ((k = e.key) == key ||
                    (e.hash == hash && key.equals(k))) {
                    oldValue = e.value;
                    if (!onlyIfAbsent) {
                        // 覆蓋舊值
                        e.value = value;
                        ++modCount;
                    }
                    break;
                }
                // 繼續(xù)順著鏈表走
                e = e.next;
            }
            else {
                // node 到底是不是 null稠腊,這個(gè)要看獲取鎖的過(guò)程躁染,不過(guò)和這里都沒(méi)有關(guān)系。
                // 如果不為 null架忌,那就直接將它設(shè)置為鏈表表頭吞彤;如果是null,初始化并設(shè)置為鏈表表頭叹放。
                if (node != null)
                    node.setNext(first);
                else
                    node = new HashEntry<K,V>(hash, key, value, first);
                
                int c = count + 1;
                // 如果超過(guò)了該 segment 的閾值备畦,這個(gè) segment 需要擴(kuò)容
                if (c > threshold && tab.length < MAXIMUM_CAPACITY)
                    rehash(node); // 擴(kuò)容后面也會(huì)具體分析
                else
                    // 沒(méi)有達(dá)到閾值,將 node 放到數(shù)組 tab 的 index 位置许昨,
                    // 其實(shí)就是將新的節(jié)點(diǎn)設(shè)置成原鏈表的表頭
                    setEntryAt(tab, index, node);
                ++modCount;
                count = c;
                oldValue = null;
                break;
            }
        }
    } finally {
        // 解鎖
        unlock();
    }
    return oldValue;
}

整體流程還是比較簡(jiǎn)單的懂盐,由于有獨(dú)占鎖的保護(hù),所以 segment 內(nèi)部的操作并不復(fù)雜糕档。至于這里面的并發(fā)問(wèn)題莉恼,我們稍后再進(jìn)行介紹。

到這里 put 操作就結(jié)束了速那,接下來(lái)俐银,我們說(shuō)一說(shuō)其中幾步關(guān)鍵的操作。

初始化槽: ensureSegment

ConcurrentHashMap 初始化的時(shí)候會(huì)初始化第一個(gè)槽 segment[0]端仰,對(duì)于其他槽來(lái)說(shuō)捶惜,在插入第一個(gè)值的時(shí)候進(jìn)行初始化。

這里需要考慮并發(fā)荔烧,因?yàn)楹芸赡軙?huì)有多個(gè)線(xiàn)程同時(shí)進(jìn)來(lái)初始化同一個(gè)槽 segment[k]吱七,不過(guò)只要有一個(gè)成功了就可以。

private Segment<K,V> ensureSegment(int k) {
    final Segment<K,V>[] ss = this.segments;
    long u = (k << SSHIFT) + SBASE; // raw offset
    Segment<K,V> seg;
    if ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u)) == null) {
        // 這里看到為什么之前要初始化 segment[0] 了鹤竭,
        // 使用當(dāng)前 segment[0] 處的數(shù)組長(zhǎng)度和負(fù)載因子來(lái)初始化 segment[k]
        // 為什么要用“當(dāng)前”踊餐,因?yàn)?segment[0] 可能早就擴(kuò)容過(guò)了
        Segment<K,V> proto = ss[0];
        int cap = proto.table.length;
        float lf = proto.loadFactor;
        int threshold = (int)(cap * lf);
        
        // 初始化 segment[k] 內(nèi)部的數(shù)組
        HashEntry<K,V>[] tab = (HashEntry<K,V>[])new HashEntry[cap];
        if ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u))
            == null) { // 再次檢查一遍該槽是否被其他線(xiàn)程初始化了。
          
            Segment<K,V> s = new Segment<K,V>(lf, threshold, tab);
            // 使用 while 循環(huán)臀稚,內(nèi)部用 CAS吝岭,當(dāng)前線(xiàn)程成功設(shè)值或其他線(xiàn)程成功設(shè)值后,退出
            while ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u))
                   == null) {
                if (UNSAFE.compareAndSwapObject(ss, u, null, seg = s))
                    break;
            }
        }
    }
    return seg;
}

總的來(lái)說(shuō),ensureSegment(int k) 比較簡(jiǎn)單窜管,對(duì)于并發(fā)操作使用 CAS 進(jìn)行控制散劫。

我沒(méi)搞懂這里為什么要搞一個(gè) while 循環(huán),CAS 失敗不就代表有其他線(xiàn)程成功了嗎幕帆,為什么要再進(jìn)行判斷获搏?

感謝評(píng)論區(qū)的李子木,如果當(dāng)前線(xiàn)程 CAS 失敗蜓肆,這里的 while 循環(huán)是為了將 seg 賦值返回。

獲取寫(xiě)入鎖: scanAndLockForPut

前面我們看到谋币,在往某個(gè) segment 中 put 的時(shí)候仗扬,首先會(huì)調(diào)用 node = tryLock() ? null : scanAndLockForPut(key, hash, value),也就是說(shuō)先進(jìn)行一次 tryLock() 快速獲取該 segment 的獨(dú)占鎖蕾额,如果失敗早芭,那么進(jìn)入到 scanAndLockForPut 這個(gè)方法來(lái)獲取鎖。

下面我們來(lái)具體分析這個(gè)方法中是怎么控制加鎖的诅蝶。

private HashEntry<K,V> scanAndLockForPut(K key, int hash, V value) {
    HashEntry<K,V> first = entryForHash(this, hash);
    HashEntry<K,V> e = first;
    HashEntry<K,V> node = null;
    int retries = -1; // negative while locating node
    
    // 循環(huán)獲取鎖
    while (!tryLock()) {
        HashEntry<K,V> f; // to recheck first below
        if (retries < 0) {
            if (e == null) {
                if (node == null) // speculatively create node
                    // 進(jìn)到這里說(shuō)明數(shù)組該位置的鏈表是空的退个,沒(méi)有任何元素
                    // 當(dāng)然,進(jìn)到這里的另一個(gè)原因是 tryLock() 失敗调炬,所以該槽存在并發(fā)语盈,不一定是該位置
                    node = new HashEntry<K,V>(hash, key, value, null);
                retries = 0;
            }
            else if (key.equals(e.key))
                retries = 0;
            else
                // 順著鏈表往下走
                e = e.next;
        }
        // 重試次數(shù)如果超過(guò) MAX_SCAN_RETRIES(單核1多核64),那么不搶了缰泡,進(jìn)入到阻塞隊(duì)列等待鎖
        //    lock() 是阻塞方法刀荒,直到獲取鎖后返回
        else if (++retries > MAX_SCAN_RETRIES) {
            lock();
            break;
        }
        else if ((retries & 1) == 0 &&
                 // 這個(gè)時(shí)候是有大問(wèn)題了,那就是有新的元素進(jìn)到了鏈表棘钞,成為了新的表頭
                 //     所以這邊的策略是缠借,相當(dāng)于重新走一遍這個(gè) scanAndLockForPut 方法
                 (f = entryForHash(this, hash)) != first) {
            e = first = f; // re-traverse if entry changed
            retries = -1;
        }
    }
    return node;
}

這個(gè)方法有兩個(gè)出口,一個(gè)是 tryLock() 成功了宜猜,循環(huán)終止泼返,另一個(gè)就是重試次數(shù)超過(guò)了 MAX_SCAN_RETRIES,進(jìn)到 lock() 方法姨拥,此方法會(huì)阻塞等待绅喉,直到成功拿到獨(dú)占鎖。

這個(gè)方法就是看似復(fù)雜叫乌,但是其實(shí)就是做了一件事霹疫,那就是獲取該 segment 的獨(dú)占鎖,如果需要的話(huà)順便實(shí)例化了一下 node综芥。

擴(kuò)容: rehash

重復(fù)一下丽蝎,segment 數(shù)組不能擴(kuò)容,擴(kuò)容是 segment 數(shù)組某個(gè)位置內(nèi)部的數(shù)組 HashEntry<K,V>[] 進(jìn)行擴(kuò)容,擴(kuò)容后屠阻,容量為原來(lái)的 2 倍红省。

首先,我們要回顧一下觸發(fā)擴(kuò)容的地方国觉,put 的時(shí)候吧恃,如果判斷該值的插入會(huì)導(dǎo)致該 segment 的元素個(gè)數(shù)超過(guò)閾值,那么先進(jìn)行擴(kuò)容麻诀,再插值痕寓,讀者這個(gè)時(shí)候可以回去 put 方法看一眼。

該方法不需要考慮并發(fā)蝇闭,因?yàn)榈竭@里的時(shí)候呻率,是持有該 segment 的獨(dú)占鎖的。

// 方法參數(shù)上的 node 是這次擴(kuò)容后呻引,需要添加到新的數(shù)組中的數(shù)據(jù)礼仗。
private void rehash(HashEntry<K,V> node) {
    HashEntry<K,V>[] oldTable = table;
    int oldCapacity = oldTable.length;
    // 2 倍
    int newCapacity = oldCapacity << 1;
    threshold = (int)(newCapacity * loadFactor);
    // 創(chuàng)建新數(shù)組
    HashEntry<K,V>[] newTable =
        (HashEntry<K,V>[]) new HashEntry[newCapacity];
    // 新的掩碼,如從 16 擴(kuò)容到 32逻悠,那么 sizeMask 為 31元践,對(duì)應(yīng)二進(jìn)制 ‘000...00011111’
    int sizeMask = newCapacity - 1;
    
    // 遍歷原數(shù)組,老套路童谒,將原數(shù)組位置 i 處的鏈表拆分到 新數(shù)組位置 i 和 i+oldCap 兩個(gè)位置
    for (int i = 0; i < oldCapacity ; i++) {
        // e 是鏈表的第一個(gè)元素
        HashEntry<K,V> e = oldTable[i];
        if (e != null) {
            HashEntry<K,V> next = e.next;
            // 計(jì)算應(yīng)該放置在新數(shù)組中的位置单旁,
            // 假設(shè)原數(shù)組長(zhǎng)度為 16,e 在 oldTable[3] 處饥伊,那么 idx 只可能是 3 或者是 3 + 16 = 19
            int idx = e.hash & sizeMask;
            if (next == null)   // 該位置處只有一個(gè)元素慎恒,那比較好辦
                newTable[idx] = e;
            else { // Reuse consecutive sequence at same slot
                // e 是鏈表表頭
                HashEntry<K,V> lastRun = e;
                // idx 是當(dāng)前鏈表的頭結(jié)點(diǎn) e 的新位置
                int lastIdx = idx;

                // 下面這個(gè) for 循環(huán)會(huì)找到一個(gè) lastRun 節(jié)點(diǎn),這個(gè)節(jié)點(diǎn)之后的所有元素是將要放到一起的
                for (HashEntry<K,V> last = next;
                     last != null;
                     last = last.next) {
                    int k = last.hash & sizeMask;
                    if (k != lastIdx) {
                        lastIdx = k;
                        lastRun = last;
                    }
                }
                // 將 lastRun 及其之后的所有節(jié)點(diǎn)組成的這個(gè)鏈表放到 lastIdx 這個(gè)位置
                newTable[lastIdx] = lastRun;
                // 下面的操作是處理 lastRun 之前的節(jié)點(diǎn)撵渡,
                //    這些節(jié)點(diǎn)可能分配在另一個(gè)鏈表中融柬,也可能分配到上面的那個(gè)鏈表中
                for (HashEntry<K,V> p = e; p != lastRun; p = p.next) {
                    V v = p.value;
                    int h = p.hash;
                    int k = h & sizeMask;
                    HashEntry<K,V> n = newTable[k];
                    newTable[k] = new HashEntry<K,V>(h, p.key, v, n);
                }
            }
        }
    }
    // 將新來(lái)的 node 放到新數(shù)組中剛剛的 兩個(gè)鏈表之一 的 頭部
    int nodeIndex = node.hash & sizeMask; // add the new node
    node.setNext(newTable[nodeIndex]);
    newTable[nodeIndex] = node;
    table = newTable;
}

這里的擴(kuò)容比之前的 HashMap 要復(fù)雜一些,代碼難懂一點(diǎn)趋距。上面有兩個(gè)挨著的 for 循環(huán)粒氧,第一個(gè) for 有什么用呢?

仔細(xì)一看發(fā)現(xiàn)节腐,如果沒(méi)有第一個(gè) for 循環(huán)外盯,也是可以工作的,但是翼雀,這個(gè) for 循環(huán)下來(lái)饱苟,如果 lastRun 的后面還有比較多的節(jié)點(diǎn),那么這次就是值得的狼渊。因?yàn)槲覀冎恍枰寺?lastRun 前面的節(jié)點(diǎn)箱熬,后面的一串節(jié)點(diǎn)跟著 lastRun 走就是了类垦,不需要做任何操作。

我覺(jué)得 Doug Lea 的這個(gè)想法也是挺有意思的城须,不過(guò)比較壞的情況就是每次 lastRun 都是鏈表的最后一個(gè)元素或者很靠后的元素蚤认,那么這次遍歷就有點(diǎn)浪費(fèi)了。不過(guò) Doug Lea 也說(shuō)了糕伐,根據(jù)統(tǒng)計(jì)砰琢,如果使用默認(rèn)的閾值,大約只有 1/6 的節(jié)點(diǎn)需要克隆良瞧。

get 過(guò)程分析

相對(duì)于 put 來(lái)說(shuō)陪汽,get 真的不要太簡(jiǎn)單。

  1. 計(jì)算 hash 值褥蚯,找到 segment 數(shù)組中的具體位置挚冤,或我們前面用的“槽”
  2. 槽中也是一個(gè)數(shù)組,根據(jù) hash 找到數(shù)組中具體的位置
  3. 到這里是鏈表了遵岩,順著鏈表進(jìn)行查找即可
public V get(Object key) {
    Segment<K,V> s; // manually integrate access methods to reduce overhead
    HashEntry<K,V>[] tab;
    // 1. hash 值
    int h = hash(key);
    long u = (((h >>> segmentShift) & segmentMask) << SSHIFT) + SBASE;
    // 2. 根據(jù) hash 找到對(duì)應(yīng)的 segment
    if ((s = (Segment<K,V>)UNSAFE.getObjectVolatile(segments, u)) != null &&
        (tab = s.table) != null) {
        // 3. 找到segment 內(nèi)部數(shù)組相應(yīng)位置的鏈表你辣,遍歷
        for (HashEntry<K,V> e = (HashEntry<K,V>) UNSAFE.getObjectVolatile
                 (tab, ((long)(((tab.length - 1) & h)) << TSHIFT) + TBASE);
             e != null; e = e.next) {
            K k;
            if ((k = e.key) == key || (e.hash == h && key.equals(k)))
                return e.value;
        }
    }
    return null;
}

并發(fā)問(wèn)題分析

現(xiàn)在我們已經(jīng)說(shuō)完了 put 過(guò)程和 get 過(guò)程巡通,我們可以看到 get 過(guò)程中是沒(méi)有加鎖的尘执,那自然我們就需要去考慮并發(fā)問(wèn)題。

添加節(jié)點(diǎn)的操作 put 和刪除節(jié)點(diǎn)的操作 remove 都是要加 segment 上的獨(dú)占鎖的宴凉,所以它們之間自然不會(huì)有問(wèn)題誊锭,我們需要考慮的問(wèn)題就是 get 的時(shí)候在同一個(gè) segment 中發(fā)生了 put 或 remove 操作。

  1. put 操作的線(xiàn)程安全性弥锄。

    1. 初始化槽丧靡,這個(gè)我們之前就說(shuō)過(guò)了,使用了 CAS 來(lái)初始化 Segment 中的數(shù)組籽暇。
    2. 添加節(jié)點(diǎn)到鏈表的操作是插入到表頭的温治,所以,如果這個(gè)時(shí)候 get 操作在鏈表遍歷的過(guò)程已經(jīng)到了中間戒悠,是不會(huì)影響的熬荆。當(dāng)然,另一個(gè)并發(fā)問(wèn)題就是 get 操作在 put 之后绸狐,需要保證剛剛插入表頭的節(jié)點(diǎn)被讀取卤恳,這個(gè)依賴(lài)于 setEntryAt 方法中使用的 UNSAFE.putOrderedObject询吴。
    3. 擴(kuò)容熊镣。擴(kuò)容是新創(chuàng)建了數(shù)組郎逃,然后進(jìn)行遷移數(shù)據(jù)藕赞,最后面將 newTable 設(shè)置給屬性 table今布。所以染突,如果 get 操作此時(shí)也在進(jìn)行唁情,那么也沒(méi)關(guān)系,如果 get 先行冠息,那么就是在舊的 table 上做查詢(xún)操作挪凑;而 put 先行,那么 put 操作的可見(jiàn)性保證就是 table 使用了 volatile 關(guān)鍵字逛艰。
  2. remove 操作的線(xiàn)程安全性躏碳。

    remove 操作我們沒(méi)有分析源碼,所以這里說(shuō)的讀者感興趣的話(huà)還是需要到源碼中去求實(shí)一下的散怖。

    get 操作需要遍歷鏈表菇绵,但是 remove 操作會(huì)"破壞"鏈表。

    如果 remove 破壞的節(jié)點(diǎn) get 操作已經(jīng)過(guò)去了镇眷,那么這里不存在任何問(wèn)題咬最。

    如果 remove 先破壞了一個(gè)節(jié)點(diǎn),分兩種情況考慮欠动。 1永乌、如果此節(jié)點(diǎn)是頭結(jié)點(diǎn),那么需要將頭結(jié)點(diǎn)的 next 設(shè)置為數(shù)組該位置的元素具伍,table 雖然使用了 volatile 修飾翅雏,但是 volatile 并不能提供數(shù)組內(nèi)部操作的可見(jiàn)性保證,所以源碼中使用了 UNSAFE 來(lái)操作數(shù)組人芽,請(qǐng)看方法 setEntryAt望几。2、如果要?jiǎng)h除的節(jié)點(diǎn)不是頭結(jié)點(diǎn)萤厅,它會(huì)將要?jiǎng)h除節(jié)點(diǎn)的后繼節(jié)點(diǎn)接到前驅(qū)節(jié)點(diǎn)中橄抹,這里的并發(fā)保證就是 next 屬性是 volatile 的。

Java8 HashMap

Java8 對(duì) HashMap 進(jìn)行了一些修改惕味,最大的不同就是利用了紅黑樹(shù)楼誓,所以其由 數(shù)組+鏈表+紅黑樹(shù) 組成。

根據(jù) Java7 HashMap 的介紹名挥,我們知道疟羹,查找的時(shí)候,根據(jù) hash 值我們能夠快速定位到數(shù)組的具體下標(biāo)躺同,但是之后的話(huà)阁猜,需要順著鏈表一個(gè)個(gè)比較下去才能找到我們需要的,時(shí)間復(fù)雜度取決于鏈表的長(zhǎng)度蹋艺,為 O(n)剃袍。

為了降低這部分的開(kāi)銷(xiāo),在 Java8 中捎谨,當(dāng)鏈表中的元素達(dá)到了 8 個(gè)時(shí)民效,會(huì)將鏈表轉(zhuǎn)換為紅黑樹(shù)憔维,在這些位置進(jìn)行查找的時(shí)候可以降低時(shí)間復(fù)雜度為 O(logN)

來(lái)一張圖簡(jiǎn)單示意一下吧:

2

注意畏邢,上圖是示意圖业扒,主要是描述結(jié)構(gòu),不會(huì)達(dá)到這個(gè)狀態(tài)的舒萎,因?yàn)檫@么多數(shù)據(jù)的時(shí)候早就擴(kuò)容了程储。

下面,我們還是用代碼來(lái)介紹吧臂寝,個(gè)人感覺(jué)章鲤,Java8 的源碼可讀性要差一些,不過(guò)精簡(jiǎn)一些咆贬。

Java7 中使用 Entry 來(lái)代表每個(gè) HashMap 中的數(shù)據(jù)節(jié)點(diǎn)败徊,Java8 中使用 Node,基本沒(méi)有區(qū)別掏缎,都是 key皱蹦,value,hash 和 next 這四個(gè)屬性眷蜈,不過(guò)沪哺,Node 只能用于鏈表的情況,紅黑樹(shù)的情況需要使用 TreeNode端蛆。

我們根據(jù)數(shù)組元素中凤粗,第一個(gè)節(jié)點(diǎn)數(shù)據(jù)類(lèi)型是 Node 還是 TreeNode 來(lái)判斷該位置下是鏈表還是紅黑樹(shù)的酥泛。

put 過(guò)程分析

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

// 第三個(gè)參數(shù) onlyIfAbsent 如果是 true今豆,那么只有在不存在該 key 時(shí)才會(huì)進(jìn)行 put 操作
// 第四個(gè)參數(shù) evict 我們這里不關(guān)心
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 第一次 put 值的時(shí)候,會(huì)觸發(fā)下面的 resize()柔袁,類(lèi)似 java7 的第一次 put 也要初始化數(shù)組長(zhǎng)度
    // 第一次 resize 和后續(xù)的擴(kuò)容有些不一樣呆躲,因?yàn)檫@次是數(shù)組從 null 初始化到默認(rèn)的 16 或自定義的初始容量
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 找到具體的數(shù)組下標(biāo),如果此位置沒(méi)有值捶索,那么直接初始化一下 Node 并放置在這個(gè)位置就可以了
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
  
    else {// 數(shù)組該位置有數(shù)據(jù)
        Node<K,V> e; K k;
        // 首先插掂,判斷該位置的第一個(gè)數(shù)據(jù)和我們要插入的數(shù)據(jù),key 是不是"相等"腥例,如果是辅甥,取出這個(gè)節(jié)點(diǎn)
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        // 如果該節(jié)點(diǎn)是代表紅黑樹(shù)的節(jié)點(diǎn),調(diào)用紅黑樹(shù)的插值方法燎竖,本文不展開(kāi)說(shuō)紅黑樹(shù)
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            // 到這里璃弄,說(shuō)明數(shù)組該位置上是一個(gè)鏈表
            for (int binCount = 0; ; ++binCount) {
                // 插入到鏈表的最后面(Java7 是插入到鏈表的最前面)
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // TREEIFY_THRESHOLD 為 8,所以构回,如果新插入的值是鏈表中的第 8 個(gè)
                    // 會(huì)觸發(fā)下面的 treeifyBin夏块,也就是將鏈表轉(zhuǎn)換為紅黑樹(shù)
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 如果在該鏈表中找到了"相等"的 key(== 或 equals)
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    // 此時(shí) break疏咐,那么 e 為鏈表中[與要插入的新值的 key "相等"]的 node
                    break;
                p = e;
            }
        }
        // e!=null 說(shuō)明存在舊值的key與要插入的key"相等"
        // 對(duì)于我們分析的put操作,下面這個(gè) if 其實(shí)就是進(jìn)行 "值覆蓋"脐供,然后返回舊值
        if (e != null) {
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    // 如果 HashMap 由于新插入這個(gè)值導(dǎo)致 size 已經(jīng)超過(guò)了閾值浑塞,需要進(jìn)行擴(kuò)容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

和 Java7 稍微有點(diǎn)不一樣的地方就是,Java7 是先擴(kuò)容后插入新值的政己,Java8 先插值再擴(kuò)容酌壕,不過(guò)這個(gè)不重要。

數(shù)組擴(kuò)容

resize() 方法用于初始化數(shù)組數(shù)組擴(kuò)容歇由,每次擴(kuò)容后仅孩,容量為原來(lái)的 2 倍,并進(jìn)行數(shù)據(jù)遷移印蓖。

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) { // 對(duì)應(yīng)數(shù)組擴(kuò)容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 將數(shù)組大小擴(kuò)大一倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            // 將閾值擴(kuò)大一倍
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // 對(duì)應(yīng)使用 new HashMap(int initialCapacity) 初始化后辽慕,第一次 put 的時(shí)候
        newCap = oldThr;
    else {// 對(duì)應(yīng)使用 new HashMap() 初始化后,第一次 put 的時(shí)候
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;

    // 用新的數(shù)組大小初始化新的數(shù)組
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab; // 如果是初始化數(shù)組赦肃,到這里就結(jié)束了溅蛉,返回 newTab 即可
    
    if (oldTab != null) {
        // 開(kāi)始遍歷原數(shù)組,進(jìn)行數(shù)據(jù)遷移他宛。
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                // 如果該數(shù)組位置上只有單個(gè)元素船侧,那就簡(jiǎn)單了,簡(jiǎn)單遷移這個(gè)元素就可以了
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                // 如果是紅黑樹(shù)厅各,具體我們就不展開(kāi)了
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { 
                    // 這塊是處理鏈表的情況镜撩,
                    // 需要將此鏈表拆成兩個(gè)鏈表,放到新的數(shù)組中队塘,并且保留原來(lái)的先后順序
                    // loHead袁梗、loTail 對(duì)應(yīng)一條鏈表,hiHead憔古、hiTail 對(duì)應(yīng)另一條鏈表遮怜,代碼還是比較簡(jiǎn)單的
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        // 第一條鏈表
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        // 第二條鏈表的新的位置是 j + oldCap,這個(gè)很好理解
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

get 過(guò)程分析

相對(duì)于 put 來(lái)說(shuō)鸿市,get 真的太簡(jiǎn)單了锯梁。

  1. 計(jì)算 key 的 hash 值,根據(jù) hash 值找到對(duì)應(yīng)數(shù)組下標(biāo): hash & (length-1)
  2. 判斷數(shù)組該位置處的元素是否剛好就是我們要找的焰情,如果不是陌凳,走第三步
  3. 判斷該元素類(lèi)型是否是 TreeNode,如果是内舟,用紅黑樹(shù)的方法取數(shù)據(jù)合敦,如果不是,走第四步
  4. 遍歷鏈表谒获,直到找到相等(==或equals)的 key
public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        // 判斷第一個(gè)節(jié)點(diǎn)是不是就是需要的
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            // 判斷是否是紅黑樹(shù)
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            
            // 鏈表遍歷
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

Java8 ConcurrentHashMap

Java7 中實(shí)現(xiàn)的 ConcurrentHashMap 說(shuō)實(shí)話(huà)還是比較復(fù)雜的蛤肌,Java8 對(duì) ConcurrentHashMap 進(jìn)行了比較大的改動(dòng)壁却。建議讀者可以參考 Java8 中 HashMap 相對(duì)于 Java7 HashMap 的改動(dòng),對(duì)于 ConcurrentHashMap裸准,Java8 也引入了紅黑樹(shù)展东。

說(shuō)實(shí)話(huà),Java8 ConcurrentHashMap 源碼真心不簡(jiǎn)單炒俱,最難的在于擴(kuò)容盐肃,數(shù)據(jù)遷移操作不容易看懂。

我們先用一個(gè)示意圖來(lái)描述下其結(jié)構(gòu):

4

結(jié)構(gòu)上和 Java8 的 HashMap 基本上一樣权悟,不過(guò)它要保證線(xiàn)程安全性砸王,所以在源碼上確實(shí)要復(fù)雜一些。

初始化

// 這構(gòu)造函數(shù)里峦阁,什么都不干
public ConcurrentHashMap() {
}
public ConcurrentHashMap(int initialCapacity) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException();
    int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
               MAXIMUM_CAPACITY :
               tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
    this.sizeCtl = cap;
}

這個(gè)初始化方法有點(diǎn)意思谦铃,通過(guò)提供初始容量,計(jì)算了 sizeCtl榔昔,sizeCtl = 【 (1.5 * initialCapacity + 1)驹闰,然后向上取最近的 2 的 n 次方】。如 initialCapacity 為 10撒会,那么得到 sizeCtl 為 16嘹朗,如果 initialCapacity 為 11,得到 sizeCtl 為 32诵肛。

sizeCtl 這個(gè)屬性使用的場(chǎng)景很多屹培,不過(guò)只要跟著文章的思路來(lái),就不會(huì)被它搞暈了怔檩。

如果你愛(ài)折騰褪秀,也可以看下另一個(gè)有三個(gè)參數(shù)的構(gòu)造方法,這里我就不說(shuō)了珠洗,大部分時(shí)候溜歪,我們會(huì)使用無(wú)參構(gòu)造函數(shù)進(jìn)行實(shí)例化若专,我們也按照這個(gè)思路來(lái)進(jìn)行源碼分析吧许蓖。

put 過(guò)程分析

仔細(xì)地一行一行代碼看下去:

public V put(K key, V value) {
    return putVal(key, value, false);
}
final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    // 得到 hash 值
    int hash = spread(key.hashCode());
    // 用于記錄相應(yīng)鏈表的長(zhǎng)度
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        // 如果數(shù)組"空",進(jìn)行數(shù)組初始化
        if (tab == null || (n = tab.length) == 0)
            // 初始化數(shù)組调衰,后面會(huì)詳細(xì)介紹
            tab = initTable();
        
        // 找該 hash 值對(duì)應(yīng)的數(shù)組下標(biāo)膊爪,得到第一個(gè)節(jié)點(diǎn) f
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            // 如果數(shù)組該位置為空,
            //    用一次 CAS 操作將這個(gè)新值放入其中即可嚎莉,這個(gè) put 操作差不多就結(jié)束了米酬,可以拉到最后面了
            //       如果 CAS 失敗,那就是有并發(fā)操作趋箩,進(jìn)到下一個(gè)循環(huán)就好了
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        // hash 居然可以等于 MOVED赃额,這個(gè)需要到后面才能看明白加派,不過(guò)從名字上也能猜到,肯定是因?yàn)樵跀U(kuò)容
        else if ((fh = f.hash) == MOVED)
            // 幫助數(shù)據(jù)遷移跳芳,這個(gè)等到看完數(shù)據(jù)遷移部分的介紹后芍锦,再理解這個(gè)就很簡(jiǎn)單了
            tab = helpTransfer(tab, f);
        
        else { // 到這里就是說(shuō),f 是該位置的頭結(jié)點(diǎn)飞盆,而且不為空
            
            V oldVal = null;
            // 獲取數(shù)組該位置的頭結(jié)點(diǎn)的監(jiān)視器鎖
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    if (fh >= 0) { // 頭結(jié)點(diǎn)的 hash 值大于 0娄琉,說(shuō)明是鏈表
                        // 用于累加,記錄鏈表的長(zhǎng)度
                        binCount = 1;
                        // 遍歷鏈表
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            // 如果發(fā)現(xiàn)了"相等"的 key吓歇,判斷是否要進(jìn)行值覆蓋孽水,然后也就可以 break 了
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            // 到了鏈表的最末端,將這個(gè)新值放到鏈表的最后面
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    else if (f instanceof TreeBin) { // 紅黑樹(shù)
                        Node<K,V> p;
                        binCount = 2;
                        // 調(diào)用紅黑樹(shù)的插值方法插入新節(jié)點(diǎn)
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }

            if (binCount != 0) {
                // 判斷是否要將鏈表轉(zhuǎn)換為紅黑樹(shù)城看,臨界值和 HashMap 一樣女气,也是 8
                if (binCount >= TREEIFY_THRESHOLD)
                    // 這個(gè)方法和 HashMap 中稍微有一點(diǎn)點(diǎn)不同,那就是它不是一定會(huì)進(jìn)行紅黑樹(shù)轉(zhuǎn)換测柠,
                    // 如果當(dāng)前數(shù)組的長(zhǎng)度小于 64主卫,那么會(huì)選擇進(jìn)行數(shù)組擴(kuò)容,而不是轉(zhuǎn)換為紅黑樹(shù)
                    //    具體源碼我們就不看了鹃愤,擴(kuò)容部分后面說(shuō)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    // 
    addCount(1L, binCount);
    return null;
}

put 的主流程看完了簇搅,但是至少留下了幾個(gè)問(wèn)題,第一個(gè)是初始化软吐,第二個(gè)是擴(kuò)容瘩将,第三個(gè)是幫助數(shù)據(jù)遷移,這些我們都會(huì)在后面進(jìn)行一一介紹凹耙。

初始化數(shù)組:initTable

這個(gè)比較簡(jiǎn)單姿现,主要就是初始化一個(gè)合適大小的數(shù)組,然后會(huì)設(shè)置 sizeCtl肖抱。

初始化方法中的并發(fā)問(wèn)題是通過(guò)對(duì) sizeCtl 進(jìn)行一個(gè) CAS 操作來(lái)控制的备典。

private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    while ((tab = table) == null || tab.length == 0) {
        // 初始化的"功勞"被其他線(xiàn)程"搶去"了
        if ((sc = sizeCtl) < 0)
            Thread.yield(); // lost initialization race; just spin
        // CAS 一下,將 sizeCtl 設(shè)置為 -1意述,代表?yè)尩搅随i
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                if ((tab = table) == null || tab.length == 0) {
                    // DEFAULT_CAPACITY 默認(rèn)初始容量是 16
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    // 初始化數(shù)組提佣,長(zhǎng)度為 16 或初始化時(shí)提供的長(zhǎng)度
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    // 將這個(gè)數(shù)組賦值給 table,table 是 volatile 的
                    table = tab = nt;
                    // 如果 n 為 16 的話(huà)荤崇,那么這里 sc = 12
                    // 其實(shí)就是 0.75 * n
                    sc = n - (n >>> 2);
                }
            } finally {
                // 設(shè)置 sizeCtl 為 sc拌屏,我們就當(dāng)是 12 吧
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

鏈表轉(zhuǎn)紅黑樹(shù): treeifyBin

前面我們?cè)?put 源碼分析也說(shuō)過(guò),treeifyBin 不一定就會(huì)進(jìn)行紅黑樹(shù)轉(zhuǎn)換术荤,也可能是僅僅做數(shù)組擴(kuò)容倚喂。我們還是進(jìn)行源碼分析吧。

private final void treeifyBin(Node<K,V>[] tab, int index) {
    Node<K,V> b; int n, sc;
    if (tab != null) {
        // MIN_TREEIFY_CAPACITY 為 64
        // 所以瓣戚,如果數(shù)組長(zhǎng)度小于 64 的時(shí)候端圈,其實(shí)也就是 32 或者 16 或者更小的時(shí)候焦读,會(huì)進(jìn)行數(shù)組擴(kuò)容
        if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
            // 后面我們?cè)僭敿?xì)分析這個(gè)方法
            tryPresize(n << 1);
        // b 是頭結(jié)點(diǎn)
        else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {
            // 加鎖
            synchronized (b) {
            
                if (tabAt(tab, index) == b) {
                    // 下面就是遍歷鏈表,建立一顆紅黑樹(shù)
                    TreeNode<K,V> hd = null, tl = null;
                    for (Node<K,V> e = b; e != null; e = e.next) {
                        TreeNode<K,V> p =
                            new TreeNode<K,V>(e.hash, e.key, e.val,
                                              null, null);
                        if ((p.prev = tl) == null)
                            hd = p;
                        else
                            tl.next = p;
                        tl = p;
                    }
                    // 將紅黑樹(shù)設(shè)置到數(shù)組相應(yīng)位置中
                    setTabAt(tab, index, new TreeBin<K,V>(hd));
                }
            }
        }
    }
}

擴(kuò)容:tryPresize

如果說(shuō) Java8 ConcurrentHashMap 的源碼不簡(jiǎn)單舱权,那么說(shuō)的就是擴(kuò)容操作和遷移操作吨灭。

這個(gè)方法要完完全全看懂還需要看之后的 transfer 方法,讀者應(yīng)該提前知道這點(diǎn)刑巧。

這里的擴(kuò)容也是做翻倍擴(kuò)容的喧兄,擴(kuò)容后數(shù)組容量為原來(lái)的 2 倍。

// 首先要說(shuō)明的是啊楚,方法參數(shù) size 傳進(jìn)來(lái)的時(shí)候就已經(jīng)翻了倍了
private final void tryPresize(int size) {
    // c:size 的 1.5 倍吠冤,再加 1,再往上取最近的 2 的 n 次方恭理。
    int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
        tableSizeFor(size + (size >>> 1) + 1);
    int sc;
    while ((sc = sizeCtl) >= 0) {
        Node<K,V>[] tab = table; int n;
        
        // 這個(gè) if 分支和之前說(shuō)的初始化數(shù)組的代碼基本上是一樣的拯辙,在這里,我們可以不用管這塊代碼
        if (tab == null || (n = tab.length) == 0) {
            n = (sc > c) ? sc : c;
            if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if (table == tab) {
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = nt;
                        sc = n - (n >>> 2); // 0.75 * n
                    }
                } finally {
                    sizeCtl = sc;
                }
            }
        }
        else if (c <= sc || n >= MAXIMUM_CAPACITY)
            break;
        else if (tab == table) {
            // 我沒(méi)看懂 rs 的真正含義是什么颜价,不過(guò)也關(guān)系不大
            int rs = resizeStamp(n);
            
            if (sc < 0) {
                Node<K,V>[] nt;
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
                // 2. 用 CAS 將 sizeCtl 加 1涯保,然后執(zhí)行 transfer 方法
                //    此時(shí) nextTab 不為 null
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    transfer(tab, nt);
            }
            // 1. 將 sizeCtl 設(shè)置為 (rs << RESIZE_STAMP_SHIFT) + 2)
            //     我是沒(méi)看懂這個(gè)值真正的意義是什么?不過(guò)可以計(jì)算出來(lái)的是周伦,結(jié)果是一個(gè)比較大的負(fù)數(shù)
            //  調(diào)用 transfer 方法夕春,此時(shí) nextTab 參數(shù)為 null
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                transfer(tab, null);
        }
    }
}

這個(gè)方法的核心在于 sizeCtl 值的操作,首先將其設(shè)置為一個(gè)負(fù)數(shù)专挪,然后執(zhí)行 transfer(tab, null)及志,再下一個(gè)循環(huán)將 sizeCtl 加 1,并執(zhí)行 transfer(tab, nt)寨腔,之后可能是繼續(xù) sizeCtl 加 1速侈,并執(zhí)行 transfer(tab, nt)。

所以迫卢,可能的操作就是執(zhí)行 1 次 transfer(tab, null) + 多次 transfer(tab, nt)倚搬,這里怎么結(jié)束循環(huán)的需要看完 transfer 源碼才清楚。

數(shù)據(jù)遷移:transfer

下面這個(gè)方法很點(diǎn)長(zhǎng)乾蛤,將原來(lái)的 tab 數(shù)組的元素遷移到新的 nextTab 數(shù)組中每界。

雖然我們之前說(shuō)的 tryPresize 方法中多次調(diào)用 transfer 不涉及多線(xiàn)程,但是這個(gè) transfer 方法可以在其他地方被調(diào)用幻捏,典型地盆犁,我們之前在說(shuō) put 方法的時(shí)候就說(shuō)過(guò)了,請(qǐng)往上看 put 方法篡九,是不是有個(gè)地方調(diào)用了 helpTransfer 方法,helpTransfer 方法會(huì)調(diào)用 transfer 方法的醋奠。

此方法支持多線(xiàn)程執(zhí)行榛臼,外圍調(diào)用此方法的時(shí)候伊佃,會(huì)保證第一個(gè)發(fā)起數(shù)據(jù)遷移的線(xiàn)程,nextTab 參數(shù)為 null沛善,之后再調(diào)用此方法的時(shí)候航揉,nextTab 不會(huì)為 null。

閱讀源碼之前金刁,先要理解并發(fā)操作的機(jī)制帅涂。原數(shù)組長(zhǎng)度為 n,所以我們有 n 個(gè)遷移任務(wù)尤蛮,讓每個(gè)線(xiàn)程每次負(fù)責(zé)一個(gè)小任務(wù)是最簡(jiǎn)單的媳友,每做完一個(gè)任務(wù)再檢測(cè)是否有其他沒(méi)做完的任務(wù),幫助遷移就可以了产捞,而 Doug Lea 使用了一個(gè) stride醇锚,簡(jiǎn)單理解就是步長(zhǎng),每個(gè)線(xiàn)程每次負(fù)責(zé)遷移其中的一部分坯临,如每次遷移 16 個(gè)小任務(wù)焊唬。所以,我們就需要一個(gè)全局的調(diào)度者來(lái)安排哪個(gè)線(xiàn)程執(zhí)行哪幾個(gè)任務(wù)看靠,這個(gè)就是屬性 transferIndex 的作用赶促。

第一個(gè)發(fā)起數(shù)據(jù)遷移的線(xiàn)程會(huì)將 transferIndex 指向原數(shù)組最后的位置,然后從后往前的 stride 個(gè)任務(wù)屬于第一個(gè)線(xiàn)程挟炬,然后將 transferIndex 指向新的位置芳杏,再往前的 stride 個(gè)任務(wù)屬于第二個(gè)線(xiàn)程,依此類(lèi)推辟宗。當(dāng)然爵赵,這里說(shuō)的第二個(gè)線(xiàn)程不是真的一定指代了第二個(gè)線(xiàn)程,也可以是同一個(gè)線(xiàn)程泊脐,這個(gè)讀者應(yīng)該能理解吧空幻。其實(shí)就是將一個(gè)大的遷移任務(wù)分為了一個(gè)個(gè)任務(wù)包。

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
    int n = tab.length, stride;
    
    // stride 在單核下直接等于 n容客,多核模式下為 (n>>>3)/NCPU秕铛,最小值是 16
    // stride 可以理解為”步長(zhǎng)“,有 n 個(gè)位置是需要進(jìn)行遷移的缩挑,
    //   將這 n 個(gè)任務(wù)分為多個(gè)任務(wù)包但两,每個(gè)任務(wù)包有 stride 個(gè)任務(wù)
    if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
        stride = MIN_TRANSFER_STRIDE; // subdivide range

    // 如果 nextTab 為 null,先進(jìn)行一次初始化
    //    前面我們說(shuō)了供置,外圍會(huì)保證第一個(gè)發(fā)起遷移的線(xiàn)程調(diào)用此方法時(shí)谨湘,參數(shù) nextTab 為 null
    //    之后參與遷移的線(xiàn)程調(diào)用此方法時(shí),nextTab 不會(huì)為 null
    if (nextTab == null) {
        try {
            // 容量翻倍
            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
            nextTab = nt;
        } catch (Throwable ex) {      // try to cope with OOME
            sizeCtl = Integer.MAX_VALUE;
            return;
        }
        // nextTable 是 ConcurrentHashMap 中的屬性
        nextTable = nextTab;
        // transferIndex 也是 ConcurrentHashMap 的屬性,用于控制遷移的位置
        transferIndex = n;
    }
    
    int nextn = nextTab.length;
    
    // ForwardingNode 翻譯過(guò)來(lái)就是正在被遷移的 Node
    // 這個(gè)構(gòu)造方法會(huì)生成一個(gè)Node紧阔,key坊罢、value 和 next 都為 null,關(guān)鍵是 hash 為 MOVED
    // 后面我們會(huì)看到擅耽,原數(shù)組中位置 i 處的節(jié)點(diǎn)完成遷移工作后活孩,
    //    就會(huì)將位置 i 處設(shè)置為這個(gè) ForwardingNode,用來(lái)告訴其他線(xiàn)程該位置已經(jīng)處理過(guò)了
    //    所以它其實(shí)相當(dāng)于是一個(gè)標(biāo)志乖仇。
    ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
    

    // advance 指的是做完了一個(gè)位置的遷移工作憾儒,可以準(zhǔn)備做下一個(gè)位置的了
    boolean advance = true;
    boolean finishing = false; // to ensure sweep before committing nextTab
    
    /*
     * 下面這個(gè) for 循環(huán),最難理解的在前面乃沙,而要看懂它們起趾,應(yīng)該先看懂后面的,然后再倒回來(lái)看
     * 
     */
    
    // i 是位置索引崔涂,bound 是邊界阳掐,注意是從后往前
    for (int i = 0, bound = 0;;) {
        Node<K,V> f; int fh;
        
        // 下面這個(gè) while 真的是不好理解
        // advance 為 true 表示可以進(jìn)行下一個(gè)位置的遷移了
        //   簡(jiǎn)單理解結(jié)局:i 指向了 transferIndex,bound 指向了 transferIndex-stride
        while (advance) {
            int nextIndex, nextBound;
            if (--i >= bound || finishing)
                advance = false;
            
            // 將 transferIndex 值賦給 nextIndex
            // 這里 transferIndex 一旦小于等于 0冷蚂,說(shuō)明原數(shù)組的所有位置都有相應(yīng)的線(xiàn)程去處理了
            else if ((nextIndex = transferIndex) <= 0) {
                i = -1;
                advance = false;
            }
            else if (U.compareAndSwapInt
                     (this, TRANSFERINDEX, nextIndex,
                      nextBound = (nextIndex > stride ?
                                   nextIndex - stride : 0))) {
                // 看括號(hào)中的代碼缭保,nextBound 是這次遷移任務(wù)的邊界,注意蝙茶,是從后往前
                bound = nextBound;
                i = nextIndex - 1;
                advance = false;
            }
        }
        if (i < 0 || i >= n || i + n >= nextn) {
            int sc;
            if (finishing) {
                // 所有的遷移操作已經(jīng)完成
                nextTable = null;
                // 將新的 nextTab 賦值給 table 屬性艺骂,完成遷移
                table = nextTab;
                // 重新計(jì)算 sizeCtl:n 是原數(shù)組長(zhǎng)度,所以 sizeCtl 得出的值將是新數(shù)組長(zhǎng)度的 0.75 倍
                sizeCtl = (n << 1) - (n >>> 1);
                return;
            }
            
            // 之前我們說(shuō)過(guò)隆夯,sizeCtl 在遷移前會(huì)設(shè)置為 (rs << RESIZE_STAMP_SHIFT) + 2
            // 然后钳恕,每有一個(gè)線(xiàn)程參與遷移就會(huì)將 sizeCtl 加 1,
            // 這里使用 CAS 操作對(duì) sizeCtl 進(jìn)行減 1蹄衷,代表做完了屬于自己的任務(wù)
            if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                // 任務(wù)結(jié)束忧额,方法退出
                if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                    return;
                
                // 到這里,說(shuō)明 (sc - 2) == resizeStamp(n) << RESIZE_STAMP_SHIFT愧口,
                // 也就是說(shuō)睦番,所有的遷移任務(wù)都做完了,也就會(huì)進(jìn)入到上面的 if(finishing){} 分支了
                finishing = advance = true;
                i = n; // recheck before commit
            }
        }
        // 如果位置 i 處是空的耍属,沒(méi)有任何節(jié)點(diǎn)托嚣,那么放入剛剛初始化的 ForwardingNode ”空節(jié)點(diǎn)“
        else if ((f = tabAt(tab, i)) == null)
            advance = casTabAt(tab, i, null, fwd);
        // 該位置處是一個(gè) ForwardingNode,代表該位置已經(jīng)遷移過(guò)了
        else if ((fh = f.hash) == MOVED)
            advance = true; // already processed
        else {
            // 對(duì)數(shù)組該位置處的結(jié)點(diǎn)加鎖厚骗,開(kāi)始處理數(shù)組該位置處的遷移工作
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    Node<K,V> ln, hn;
                    // 頭結(jié)點(diǎn)的 hash 大于 0示启,說(shuō)明是鏈表的 Node 節(jié)點(diǎn)
                    if (fh >= 0) {
                        // 下面這一塊和 Java7 中的 ConcurrentHashMap 遷移是差不多的,
                        // 需要將鏈表一分為二领舰,
                        //   找到原鏈表中的 lastRun夫嗓,然后 lastRun 及其之后的節(jié)點(diǎn)是一起進(jìn)行遷移的
                        //   lastRun 之前的節(jié)點(diǎn)需要進(jìn)行克隆迟螺,然后分到兩個(gè)鏈表中
                        int runBit = fh & n;
                        Node<K,V> lastRun = f;
                        for (Node<K,V> p = f.next; p != null; p = p.next) {
                            int b = p.hash & n;
                            if (b != runBit) {
                                runBit = b;
                                lastRun = p;
                            }
                        }
                        if (runBit == 0) {
                            ln = lastRun;
                            hn = null;
                        }
                        else {
                            hn = lastRun;
                            ln = null;
                        }
                        for (Node<K,V> p = f; p != lastRun; p = p.next) {
                            int ph = p.hash; K pk = p.key; V pv = p.val;
                            if ((ph & n) == 0)
                                ln = new Node<K,V>(ph, pk, pv, ln);
                            else
                                hn = new Node<K,V>(ph, pk, pv, hn);
                        }
                        // 其中的一個(gè)鏈表放在新數(shù)組的位置 i
                        setTabAt(nextTab, i, ln);
                        // 另一個(gè)鏈表放在新數(shù)組的位置 i+n
                        setTabAt(nextTab, i + n, hn);
                        // 將原數(shù)組該位置處設(shè)置為 fwd,代表該位置已經(jīng)處理完畢啤月,
                        //    其他線(xiàn)程一旦看到該位置的 hash 值為 MOVED煮仇,就不會(huì)進(jìn)行遷移了
                        setTabAt(tab, i, fwd);
                        // advance 設(shè)置為 true劳跃,代表該位置已經(jīng)遷移完畢
                        advance = true;
                    }
                    else if (f instanceof TreeBin) {
                        // 紅黑樹(shù)的遷移
                        TreeBin<K,V> t = (TreeBin<K,V>)f;
                        TreeNode<K,V> lo = null, loTail = null;
                        TreeNode<K,V> hi = null, hiTail = null;
                        int lc = 0, hc = 0;
                        for (Node<K,V> e = t.first; e != null; e = e.next) {
                            int h = e.hash;
                            TreeNode<K,V> p = new TreeNode<K,V>
                                (h, e.key, e.val, null, null);
                            if ((h & n) == 0) {
                                if ((p.prev = loTail) == null)
                                    lo = p;
                                else
                                    loTail.next = p;
                                loTail = p;
                                ++lc;
                            }
                            else {
                                if ((p.prev = hiTail) == null)
                                    hi = p;
                                else
                                    hiTail.next = p;
                                hiTail = p;
                                ++hc;
                            }
                        }
                        // 如果一分為二后谎仲,節(jié)點(diǎn)數(shù)少于 8,那么將紅黑樹(shù)轉(zhuǎn)換回鏈表
                        ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                            (hc != 0) ? new TreeBin<K,V>(lo) : t;
                        hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                            (lc != 0) ? new TreeBin<K,V>(hi) : t;
                        
                        // 將 ln 放置在新數(shù)組的位置 i
                        setTabAt(nextTab, i, ln);
                        // 將 hn 放置在新數(shù)組的位置 i+n
                        setTabAt(nextTab, i + n, hn);
                        // 將原數(shù)組該位置處設(shè)置為 fwd刨仑,代表該位置已經(jīng)處理完畢郑诺,
                        //    其他線(xiàn)程一旦看到該位置的 hash 值為 MOVED,就不會(huì)進(jìn)行遷移了
                        setTabAt(tab, i, fwd);
                        // advance 設(shè)置為 true杉武,代表該位置已經(jīng)遷移完畢
                        advance = true;
                    }
                }
            }
        }
    }
}

說(shuō)到底辙诞,transfer 這個(gè)方法并沒(méi)有實(shí)現(xiàn)所有的遷移任務(wù),每次調(diào)用這個(gè)方法只實(shí)現(xiàn)了 transferIndex 往前 stride 個(gè)位置的遷移工作轻抱,其他的需要由外圍來(lái)控制飞涂。

這個(gè)時(shí)候,再回去仔細(xì)看 tryPresize 方法可能就會(huì)更加清晰一些了祈搜。

get 過(guò)程分析

get 方法從來(lái)都是最簡(jiǎn)單的较店,這里也不例外:

  1. 計(jì)算 hash 值
  2. 根據(jù) hash 值找到數(shù)組對(duì)應(yīng)位置: (n - 1) & h
  3. 根據(jù)該位置處結(jié)點(diǎn)性質(zhì)進(jìn)行相應(yīng)查找
    • 如果該位置為 null,那么直接返回 null 就可以了
    • 如果該位置處的節(jié)點(diǎn)剛好就是我們需要的容燕,返回該節(jié)點(diǎn)的值即可
    • 如果該位置節(jié)點(diǎn)的 hash 值小于 0梁呈,說(shuō)明正在擴(kuò)容,或者是紅黑樹(shù)蘸秘,后面我們?cè)俳榻B find 方法
    • 如果以上 3 條都不滿(mǎn)足官卡,那就是鏈表,進(jìn)行遍歷比對(duì)即可
public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    int h = spread(key.hashCode());
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        // 判斷頭結(jié)點(diǎn)是否就是我們需要的節(jié)點(diǎn)
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        // 如果頭結(jié)點(diǎn)的 hash 小于 0醋虏,說(shuō)明 正在擴(kuò)容寻咒,或者該位置是紅黑樹(shù)
        else if (eh < 0)
            // 參考 ForwardingNode.find(int h, Object k) 和 TreeBin.find(int h, Object k)
            return (p = e.find(h, key)) != null ? p.val : null;
        
        // 遍歷鏈表
        while ((e = e.next) != null) {
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

簡(jiǎn)單說(shuō)一句,此方法的大部分內(nèi)容都很簡(jiǎn)單颈嚼,只有正好碰到擴(kuò)容的情況毛秘,F(xiàn)orwardingNode.find(int h, Object k) 稍微復(fù)雜一些,不過(guò)在了解了數(shù)據(jù)遷移的過(guò)程后粘舟,這個(gè)也就不難了熔脂,所以限于篇幅這里也不展開(kāi)說(shuō)了。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末柑肴,一起剝皮案震驚了整個(gè)濱河市霞揉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌晰骑,老刑警劉巖适秩,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件绊序,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡秽荞,警方通過(guò)查閱死者的電腦和手機(jī)骤公,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)扬跋,“玉大人阶捆,你說(shuō)我怎么就攤上這事∏仗” “怎么了洒试?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)朴上。 經(jīng)常有香客問(wèn)我垒棋,道長(zhǎng),這世上最難降的妖魔是什么痪宰? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任叼架,我火速辦了婚禮,結(jié)果婚禮上衣撬,老公的妹妹穿的比我還像新娘乖订。我一直安慰自己,他們只是感情好淮韭,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布垢粮。 她就那樣靜靜地躺著,像睡著了一般靠粪。 火紅的嫁衣襯著肌膚如雪蜡吧。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,441評(píng)論 1 310
  • 那天占键,我揣著相機(jī)與錄音昔善,去河邊找鬼。 笑死畔乙,一個(gè)胖子當(dāng)著我的面吹牛君仆,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播牲距,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼返咱,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了牍鞠?” 一聲冷哼從身側(cè)響起咖摹,我...
    開(kāi)封第一講書(shū)人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎难述,沒(méi)想到半個(gè)月后萤晴,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體裤唠,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡赞弥,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年衅枫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了峭弟。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡屯断,死狀恐怖文虏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情裹纳,我是刑警寧澤择葡,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布紧武,位于F島的核電站剃氧,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏阻星。R本人自食惡果不足惜朋鞍,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望妥箕。 院中可真熱鬧滥酥,春花似錦、人聲如沸畦幢。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)宇葱。三九已至瘦真,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間黍瞧,已是汗流浹背诸尽。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留印颤,地道東北人您机。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像年局,于是被迫代替她去往敵國(guó)和親际看。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容