Q:HashMap 的數(shù)據(jù)結(jié)構(gòu)?
A:哈希表結(jié)構(gòu)(鏈表散列:數(shù)組+鏈表)實現(xiàn),結(jié)合數(shù)組和鏈表的優(yōu)點沐旨。當(dāng)鏈表長度超過 8 時,鏈表轉(zhuǎn)換為紅黑樹榨婆。
transient Node<K,V>[] table;
Q:HashMap 的工作原理磁携?
A:HashMap 底層是 hash 數(shù)組和單向鏈表實現(xiàn),數(shù)組中的每個元素都是鏈表良风,由 Node 內(nèi)部類(實現(xiàn) Map.Entry<K,V>接口)實現(xiàn)谊迄,HashMap 通過 put & get 方法存儲和獲取。
存儲對象時烟央,將 K/V 鍵值傳給 put() 方法:①统诺、調(diào)用 hash(K) 方法計算 K 的 hash 值,然后結(jié)合數(shù)組長度疑俭,計算得數(shù)組下標(biāo)粮呢;②、調(diào)整數(shù)組大小(當(dāng)容器中的元素個數(shù)大于 capacity * loadfactor 時钞艇,容器會進行擴容resize 為 2n)鬼贱;
③、i.如果 K 的 hash 值在 HashMap 中不存在香璃,則執(zhí)行插入,若存在舟误,則發(fā)生碰撞葡秒;
ii.如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 true,則更新鍵值對眯牧;
iii. 如果 K 的 hash 值在 HashMap 中存在蹋岩,且它們兩者 equals 返回 false,則插入鏈表的尾部(尾插法)或者紅黑樹中(樹的添加方式)学少。(JDK 1.7 之前使用頭插法剪个、JDK 1.8 使用尾插法)
(注意:當(dāng)碰撞導(dǎo)致鏈表大于 TREEIFY_THRESHOLD = 8 時,就把鏈表轉(zhuǎn)換成紅黑樹)獲取對象時版确,將 K 傳給 get() 方法:①扣囊、調(diào)用 hash(K) 方法(計算 K 的 hash 值)從而獲取該鍵值所在鏈表的數(shù)組下標(biāo);②绒疗、順序遍歷鏈表侵歇,equals()方法查找相同 Node 鏈表中 K 值對應(yīng)的 V 值。
hashCode 是定位的吓蘑,存儲位置惕虑;equals是定性的,比較兩者是否相等
Q:當(dāng)兩個對象的 hashCode 相同會發(fā)生什么磨镶?
A:因為 hashCode 相同溃蔫,不一定就是相等的(equals方法比較),所以兩個對象所在數(shù)組的下標(biāo)相同琳猫,"碰撞"就此發(fā)生伟叛。又因為 HashMap 使用鏈表存儲對象,這個 Node 會存儲到鏈表中沸移。
Q:你知道 hash 的實現(xiàn)嗎痪伦?為什么要這樣實現(xiàn)?
A:JDK 1.8 中雹锣,是通過 hashCode() 的高 16 位異或低 16 位實現(xiàn)的:(h = k.hashCode()) ^ (h >>> 16)网沾,主要是從速度,功效和質(zhì)量來考慮的蕊爵,減少系統(tǒng)的開銷辉哥,也不會造成因為高位沒有參與下標(biāo)的計算,從而引起的碰撞攒射。
Q:為什么要用異或運算符醋旦?
A:保證了對象的 hashCode 的 32 位值只要有一位發(fā)生改變,整個 hash() 返回值就會改變会放。盡可能的減少碰撞饲齐。
Q:HashMap 的 table 的容量如何確定?loadFactor 是什么咧最? 該容量如何變化捂人?這種變化會帶來什么問題御雕?
A:①、table 數(shù)組大小是由 capacity 這個參數(shù)確定的滥搭,默認是16酸纲,也可以構(gòu)造時傳入,最大限制是1<<30瑟匆;
②闽坡、loadFactor 是裝載因子,主要目的是用來確認table 數(shù)組是否需要動態(tài)擴展愁溜,默認值是0.75疾嗅,比如table 數(shù)組大小為 16,裝載因子為 0.75 時祝谚,threshold 就是12宪迟,當(dāng) table 的實際大小超過 12 時,table就需要動態(tài)擴容交惯;
③次泽、擴容時,調(diào)用 resize() 方法席爽,將 table 長度變?yōu)樵瓉淼膬杀?/strong>(注意是 table 長度意荤,而不是 threshold)
④、如果數(shù)據(jù)很大的情況下只锻,擴展時將會帶來性能的損失玖像,在性能要求很高的地方,這種損失很可能很致命齐饮。
Q:HashMap 的遍歷方式及其性能對比
A:主要四種方式:
NO.1:for-each map.keySet() -- 只需要K值的時候,推薦使用for (String key : map.keySet()) { map.get(key); }
NO.2:for-each map.entrySet() -- 當(dāng)需要V值的時候祖驱,推薦使用
for (Map.Entry<String, String> entry : map.entrySet()) { entry.getKey(); entry.getValue(); }
NO.3:for-each map.entrySet() + 臨時變量
Set<Map.Entry<String, String>> entrySet = map.entrySet(); for (Map.Entry<String, String> entry : entrySet) { entry.getKey(); entry.getValue(); }
NO.4:for-each map.entrySet().iterator()
Iterator<Map.Entry<String, String>> iterator = map.entrySet().iterator(); while (iterator.hasNext()) { Map.Entry<String, String> entry = iterator.next(); entry.getKey(); entry.getValue(); }
Q:HashMap握恳,LinkedHashMap,TreeMap 有什么區(qū)別捺僻?
A:HashMap 參考其他問題乡洼;
LinkedHashMap 保存了記錄的插入順序,在用 Iterator 遍歷時匕坯,先取到的記錄肯定是先插入的束昵;遍歷比 HashMap 慢;
TreeMap 實現(xiàn) SortMap 接口葛峻,能夠把它保存的記錄根據(jù)鍵排序(默認按鍵值升序排序锹雏,也可以指定排序的比較器)
Q:HashMap & TreeMap & LinkedHashMap 使用場景?
A:一般情況下术奖,使用最多的是 HashMap逼侦。
HashMap:在 Map 中插入匿辩、刪除和定位元素時;
TreeMap:在需要按自然順序或自定義順序遍歷鍵的情況下榛丢;
LinkedHashMap:在需要輸出的順序和輸入的順序相同的情況下。
Q:HashMap 和 HashTable 有什么區(qū)別挺庞?
A:①晰赞、HashMap 是線程不安全的,HashTable 是線程安全的选侨;
②掖鱼、由于線程安全,所以 HashTable 的效率比不上 HashMap援制;
③戏挡、HashMap最多只允許一條記錄的鍵為null,允許多條記錄的值為null晨仑,而 HashTable 不允許褐墅;
④、HashMap 默認初始化數(shù)組的大小為16洪己,HashTable 為 11妥凳,前者擴容時,擴大兩倍答捕,后者擴大兩倍+1逝钥;
⑤、HashMap 需要重新計算 hash 值拱镐,而 HashTable 直接使用對象的 hashCode
Q:Java 中的另一個線程安全的與 HashMap 極其類似的類是什么艘款?同樣是線程安全,它與 HashTable 在線程同步上有什么不同沃琅?
A:ConcurrentHashMap 類(是 Java并發(fā)包 java.util.concurrent 中提供的一個線程安全且高效的 HashMap 實現(xiàn))哗咆。
HashTable 是使用 synchronize 關(guān)鍵字加鎖的原理(就是對對象加鎖);
而針對 ConcurrentHashMap阵难,在 JDK 1.7 中采用 分段鎖的方式岳枷;JDK 1.8 中直接采用了CAS(無鎖算法)+ synchronized。
Q:HashMap & ConcurrentHashMap 的區(qū)別呜叫?
A:除了加鎖空繁,原理上無太大區(qū)別。
另外朱庆,HashMap 的鍵值對允許有null盛泡,但是ConCurrentHashMap 都不允許。
Q:為什么 ConcurrentHashMap 比 HashTable 效率要高娱颊?
A:HashTable 使用一把鎖(鎖住整個鏈表結(jié)構(gòu))處理并發(fā)問題傲诵,多個線程競爭一把鎖凯砍,容易阻塞;
ConcurrentHashMap
JDK 1.7 中使用分段鎖(ReentrantLock + Segment + HashEntry)拴竹,相當(dāng)于把一個 HashMap 分成多個段悟衩,每段分配一把鎖,這樣支持多線程訪問栓拜。鎖粒度:基于 Segment座泳,包含多個 HashEntry。
JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹幕与。鎖粒度:Node(首結(jié)點)(實現(xiàn) Map.Entry<K,V>)挑势。鎖粒度降低了。
Q:針對 ConcurrentHashMap 鎖機制具體分析(JDK 1.7 VS JDK 1.8)啦鸣?
JDK 1.7 中潮饱,采用分段鎖的機制,實現(xiàn)并發(fā)的更新操作诫给,底層采用數(shù)組+鏈表的存儲結(jié)構(gòu)香拉,包括兩個核心靜態(tài)內(nèi)部類 Segment 和 HashEntry。
①蝙搔、Segment 繼承 ReentrantLock(重入鎖) 用來充當(dāng)鎖的角色缕溉,每個 Segment 對象守護每個散列映射表的若干個桶;
②吃型、HashEntry 用來封裝映射表的鍵-值對证鸥;
③、每個桶是由若干個 HashEntry 對象鏈接起來的鏈表勤晚。
JDK 1.8 中枉层,采用Node + CAS + Synchronized來保證并發(fā)安全。取消類 Segment赐写,直接用 table 數(shù)組存儲鍵值對鸟蜡;當(dāng) HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時,鏈表轉(zhuǎn)換為紅黑樹挺邀,提升性能揉忘。底層變更為數(shù)組 + 鏈表 + 紅黑樹。
Q:ConcurrentHashMap 在 JDK 1.8 中端铛,為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock泣矛?
A:①、粒度降低了禾蚕;
②您朽、JVM 開發(fā)團隊沒有放棄 synchronized,而且基于 JVM 的 synchronized 優(yōu)化空間更大换淆,更加自然哗总。
③几颜、在大量的數(shù)據(jù)操作下,對于 JVM 的內(nèi)存壓力讯屈,基于 API 的 ReentrantLock 會開銷更多的內(nèi)存蛋哭。
Q:ConcurrentHashMap 簡單介紹?
A:
①涮母、重要的常量:
private transient volatile int sizeCtl;
當(dāng)為負數(shù)時具壮,-1 表示正在初始化,-N 表示 N - 1 個線程正在進行擴容哈蝇;
當(dāng)為 0 時,表示 table 還沒有初始化攘已;
當(dāng)為其他正數(shù)時炮赦,表示初始化或者下一次進行擴容的大小。②样勃、數(shù)據(jù)結(jié)構(gòu):
Node 是存儲結(jié)構(gòu)的基本單元吠勘,繼承 HashMap 中的 Entry,用于存儲數(shù)據(jù)峡眶;
TreeNode 繼承 Node剧防,但是數(shù)據(jù)結(jié)構(gòu)換成了二叉樹結(jié)構(gòu),是紅黑樹的存儲結(jié)構(gòu)辫樱,用于紅黑樹中存儲數(shù)據(jù)峭拘;
TreeBin 是封裝 TreeNode 的容器,提供轉(zhuǎn)換紅黑樹的一些條件和鎖的控制狮暑。③鸡挠、存儲對象時(put() 方法):
1.如果沒有初始化,就調(diào)用 initTable() 方法來進行初始化搬男;
2.如果沒有 hash 沖突就直接 CAS 無鎖插入拣展;
3.如果需要擴容,就先進行擴容缔逛;
4.如果存在 hash 沖突备埃,就加鎖來保證線程安全,兩種情況:一種是鏈表形式就直接遍歷到尾端插入褐奴,一種是紅黑樹就按照紅黑樹結(jié)構(gòu)插入按脚;
5.如果該鏈表的數(shù)量大于閥值 8,就要先轉(zhuǎn)換成紅黑樹的結(jié)構(gòu)歉糜,break 再一次進入循環(huán)
6.如果添加成功就調(diào)用 addCount() 方法統(tǒng)計 size乘寒,并且檢查是否需要擴容。④匪补、擴容方法 transfer():默認容量為 16伞辛,擴容時烂翰,容量變?yōu)樵瓉淼?strong>兩倍。
helpTransfer():調(diào)用多個工作線程一起幫助進行擴容蚤氏,這樣的效率就會更高甘耿。⑤、獲取對象時(get()方法):
1.計算 hash 值竿滨,定位到該 table 索引位置佳恬,如果是首結(jié)點符合就返回;
2.如果遇到擴容時于游,會調(diào)用標(biāo)記正在擴容結(jié)點 ForwardingNode.find()方法毁葱,查找該結(jié)點,匹配就返回贰剥;
3.以上都不符合的話倾剿,就往下遍歷結(jié)點,匹配就返回蚌成,否則最后就返回 null前痘。
Q:ConcurrentHashMap 的并發(fā)度是什么?
A:程序運行時能夠同時更新 ConccurentHashMap 且不產(chǎn)生鎖競爭的最大線程數(shù)担忧。默認為 16芹缔,且可以在構(gòu)造函數(shù)中設(shè)置。當(dāng)用戶設(shè)置并發(fā)度時瓶盛,ConcurrentHashMap 會使用大于等于該值的最小2冪指數(shù)作為實際并發(fā)度(假如用戶設(shè)置并發(fā)度為17最欠,實際并發(fā)度則為32)