HashMap源碼簡析

說到HashMap相信大家并不陌生补胚,這是一個(gè)非常常用的以鍵值對(duì)形式存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu)甩骏,但是對(duì)其內(nèi)部原理可能不是很了解纺弊,它的內(nèi)部是以什么形式存儲(chǔ)的卧波,它的存取的性能號(hào)稱能達(dá)到O(1)又是如何實(shí)現(xiàn)的,我們從源碼來做個(gè)簡要的分析赃蛛。

主要成員變量

我們先來看以下HashMap主要有哪些成員變量

//最小值
private static final int MINIMUM_CAPACITY = 4;
//最大值恃锉,2的30次方
private static final int MAXIMUM_CAPACITY = 1 << 30;
//加載因子
static final float DEFAULT_LOAD_FACTOR = .75F;
//大小
transient int size;
//獨(dú)立的entry,專用用來處理key為null的情況
transient HashMapEntry<K, V> entryForNullKey;
//加載的閥值呕臂,當(dāng)size超過這個(gè)值時(shí)破托,將會(huì)調(diào)用doubleCapacity()方法擴(kuò)容
private transient int threshold;
//存儲(chǔ)數(shù)據(jù)的主要容器,一個(gè)HashMapEntry數(shù)組
transient HashMapEntry<K, V>[] table;
//分別是存儲(chǔ)key和value的集合
private transient Set<K> keySet;
private transient Collection<V> values;
//存儲(chǔ)Entry的集合
private transient Set<Entry<K, V>> entrySet;

可以看到存儲(chǔ)數(shù)據(jù)的主要容器是一個(gè)數(shù)組歧蒋,而HashMapEntry是我們循環(huán)遍歷HashMap時(shí)的Entry的子類土砂,下面我們看一下這個(gè)類

static class HashMapEntry<K, V> implements Entry<K, V> {
        final K key;
        V value;
        final int hash;
        HashMapEntry<K, V> next;

        HashMapEntry(K key, V value, int hash, HashMapEntry<K, V> next) {
            ...
        }
        ...
    }

table中的元素類型HashMapEntry,我們稱之為桶疏尿,HashMapEntry里一個(gè)變量hash用于存儲(chǔ)key的哈希值瘟芝,還有一個(gè)next變量也是HashMapEntry類型,可見HashMapEntry是一個(gè)單鏈表結(jié)構(gòu)褥琐,每一個(gè)桶都可以存儲(chǔ)多個(gè)元素锌俱。

下面是HashMap的主要構(gòu)造函數(shù)

public HashMap(int capacity) {
        ...  //參數(shù)判斷和capacity為0時(shí)的空表創(chuàng)建

        //將capacity控制在既定的范圍內(nèi)并保證capacity為偶數(shù)
        if (capacity < MINIMUM_CAPACITY) {
            capacity = MINIMUM_CAPACITY;
        } else if (capacity > MAXIMUM_CAPACITY) {
            capacity = MAXIMUM_CAPACITY;
        } else {
            capacity = Collections.roundUpToPowerOfTwo(capacity);
        }
        makeTable(capacity);  //創(chuàng)建一個(gè)容量大小為capacity的數(shù)組
    }

makeTable方法中有如下代碼:
threshold = (newCapacity >> 1) + (newCapacity >> 2);
其中threshold表示HashMap擴(kuò)容的閥值,意思是在初始化時(shí)threshold等于總?cè)萘?0.75(加載因子)敌呈,一旦HashMap中存儲(chǔ)的元素?cái)?shù)量超過threshold贸宏,就會(huì)對(duì)整個(gè)HashMap就行擴(kuò)容造寝。

擴(kuò)容的方法如下

private HashMapEntry<K, V>[] doubleCapacity() {
        HashMapEntry<K, V>[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            return oldTable;  //如果舊數(shù)組的容量已經(jīng)達(dá)到最大值,則直接返回
        }
        int newCapacity = oldCapacity * 2;  //將容量大小增加到以前的兩倍
        HashMapEntry<K, V>[] newTable = makeTable(newCapacity);
        if (size == 0) {  //如果當(dāng)前大小為空吭练,則直接返回新數(shù)組
            return newTable;
        }

        //把oldTable中的元素重新整理到newTable中
        for (int j = 0; j < oldCapacity; j++) {
            /*
             * Rehash the bucket using the minimum number of field writes.
             * This is the most subtle and delicate code in the class.
             */
            HashMapEntry<K, V> e = oldTable[j];
            if (e == null) {
                continue;
            }
            int highBit = e.hash & oldCapacity;
            HashMapEntry<K, V> broken = null;
            newTable[j | highBit] = e;
            for (HashMapEntry<K, V> n = e.next; n != null; e = n, n = n.next) {
                int nextHighBit = n.hash & oldCapacity;
                if (nextHighBit != highBit) {
                    if (broken == null)
                        newTable[j | nextHighBit] = n;
                    else
                        broken.next = n;
                    broken = e;
                    highBit = nextHighBit;
                }
            }
            if (broken != null)
                broken.next = null;
        }
        return newTable;
    }

在重新組裝table的過程使用了兩個(gè)for循環(huán)遍歷其中的元素诫龙,有一點(diǎn)復(fù)雜,我們先看HashMap的put方法鲫咽,看看元素是如何存儲(chǔ)的签赃。

put方法

public V put(K key, V value) {
        if (key == null) {  //先處理空值情況
            return putValueForNullKey(value);
        }

        int hash = Collections.secondaryHash(key);  //計(jì)算出key的hash值
        HashMapEntry<K, V>[] tab = table;
        int index = hash & (tab.length - 1);  //計(jì)算出key的對(duì)應(yīng)桶的下標(biāo)
        for (HashMapEntry<K, V> e = tab[index]; e != null; e = e.next) {
            if (e.hash == hash && key.equals(e.key)) {
                preModify(e);
                V oldValue = e.value;
                e.value = value;
                return oldValue;  //key存在的情況下,直接更新value
            }
        }

        // No entry for (non-null) key is present; create one
        modCount++;
        if (size++ > threshold) {
            tab = doubleCapacity();  //size大于threshold時(shí)分尸,調(diào)用擴(kuò)容的方法锦聊,得到一個(gè)新的table
            index = hash & (tab.length - 1);
        }
        addNewEntry(key, value, hash, index);  //將新的桶更新到table中
        return null;
    }

put方法中,先計(jì)算出key的hash值箩绍,然后通過和table數(shù)組的最大index進(jìn)行&操作孔庭,得到key在table里相對(duì)應(yīng)的下標(biāo)index,然后針對(duì)table[index]進(jìn)行鏈表遍歷材蛛,通過比較hash值和equals方法查找桶內(nèi)是否存在相同的key圆到,如果存在,則將新的value代替舊的存入卑吭,將舊的vaule返回芽淡;否則創(chuàng)建一個(gè)新的Entry,作為這個(gè)桶的頭節(jié)點(diǎn)陨簇,最后返回空值吐绵。其實(shí)doubleCapacity方法只是將oldTable的遍歷和newTable的定位及插入邏輯合并到了一起,原理跟put方法是十分類似的河绽。

然后我們來看一下put方法的時(shí)間復(fù)雜度,該方法其實(shí)分為4個(gè)步驟唉窃,1.根據(jù)key計(jì)算出其hash值耙饰,并計(jì)算得到相應(yīng)桶的下標(biāo)index。2.查找table中index下標(biāo)的Entry纹份。3.遍歷Entry為頭節(jié)點(diǎn)的鏈表得到我們要找的Entry苟跪。4.取出Entry的value。
其中1蔓涧、2件已、4步都能在O(1)時(shí)間內(nèi)完成。我們之前了解到當(dāng)size超過總?cè)萘?0.75后元暴,會(huì)進(jìn)行擴(kuò)容篷扩,所以大部分情況下(key的hash分布較為均勻),每個(gè)桶中的元素個(gè)數(shù) <= 1茉盏,極少數(shù)情況 >=2鉴未,所以第三步也可以在O(1)內(nèi)完成枢冤,我們可以認(rèn)為其整體時(shí)間復(fù)雜度為O(1)。

get方法的邏輯跟put基本一樣铜秆,有興趣可以自行了解一下淹真。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市连茧,隨后出現(xiàn)的幾起案子核蘸,更是在濱河造成了極大的恐慌,老刑警劉巖啸驯,帶你破解...
    沈念sama閱讀 206,482評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件值纱,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡坯汤,警方通過查閱死者的電腦和手機(jī)虐唠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來惰聂,“玉大人疆偿,你說我怎么就攤上這事〈昊希” “怎么了杆故?”我有些...
    開封第一講書人閱讀 152,762評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長溉愁。 經(jīng)常有香客問我处铛,道長,這世上最難降的妖魔是什么拐揭? 我笑而不...
    開封第一講書人閱讀 55,273評(píng)論 1 279
  • 正文 為了忘掉前任撤蟆,我火速辦了婚禮,結(jié)果婚禮上堂污,老公的妹妹穿的比我還像新娘家肯。我一直安慰自己,他們只是感情好盟猖,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,289評(píng)論 5 373
  • 文/花漫 我一把揭開白布讨衣。 她就那樣靜靜地躺著,像睡著了一般式镐。 火紅的嫁衣襯著肌膚如雪反镇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,046評(píng)論 1 285
  • 那天娘汞,我揣著相機(jī)與錄音歹茶,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛辆亏,可吹牛的內(nèi)容都是我干的风秤。 我是一名探鬼主播,決...
    沈念sama閱讀 38,351評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼扮叨,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼缤弦!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起彻磁,我...
    開封第一講書人閱讀 36,988評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤碍沐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后衷蜓,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體累提,經(jīng)...
    沈念sama閱讀 43,476評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,948評(píng)論 2 324
  • 正文 我和宋清朗相戀三年磁浇,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了斋陪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,064評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡置吓,死狀恐怖无虚,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情衍锚,我是刑警寧澤友题,帶...
    沈念sama閱讀 33,712評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站戴质,受9級(jí)特大地震影響度宦,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜告匠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,261評(píng)論 3 307
  • 文/蒙蒙 一戈抄、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧凫海,春花似錦呛凶、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽模闲。三九已至建瘫,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間尸折,已是汗流浹背啰脚。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評(píng)論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人橄浓。 一個(gè)月前我還...
    沈念sama閱讀 45,511評(píng)論 2 354
  • 正文 我出身青樓粒梦,卻偏偏與公主長得像,于是被迫代替她去往敵國和親荸实。 傳聞我的和親對(duì)象是個(gè)殘疾皇子匀们,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,802評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 一、HashMap概述 HashMap基于哈希表的Map接口的實(shí)現(xiàn)准给。此實(shí)現(xiàn)提供所有可選的映射操作泄朴,并允許使用nul...
    小陳阿飛閱讀 632評(píng)論 0 2
  • 實(shí)際上,HashSet 和 HashMap 之間有很多相似之處露氮,對(duì)于 HashSet 而言祖灰,系統(tǒng)采用 Hash 算...
    曹振華閱讀 2,508評(píng)論 1 37
  • HashMap 是 Java 面試必考的知識(shí)點(diǎn),面試官從這個(gè)小知識(shí)點(diǎn)就可以了解我們對(duì) Java 基礎(chǔ)的掌握程度畔规。網(wǎng)...
    野狗子嗷嗷嗷閱讀 6,657評(píng)論 9 107
  • HashMap 是基于哈希表的 Map 接口的非同步實(shí)現(xiàn)局扶。此實(shí)現(xiàn)提供所有可選的映射操作钩述,并允許使用 null 值和...
    正規(guī)程序員閱讀 491評(píng)論 0 51
  • 作為一個(gè)生來就是河蟹的我涕蚤,這一生便是游走在整個(gè)世界地圖上的某一角落。 偶爾會(huì)被生活所迫離開我喜歡的沼澤地涛酗,來到從未...
    艾歐尼亞的河蟹閱讀 127評(píng)論 0 2