1奴紧、HashMap 的數(shù)據(jù)結(jié)構(gòu)特姐?
A:哈希表結(jié)構(gòu)(鏈表散列:數(shù)組+鏈表)實(shí)現(xiàn),結(jié)合數(shù)組和鏈表的優(yōu)點(diǎn)黍氮。當(dāng)鏈表長度超過 8 時唐含,鏈表轉(zhuǎn)換為紅黑樹。
transient Node<K,V>\[\] table;` </pre>
2沫浆、HashMap 的工作原理捷枯?
HashMap 底層是 hash 數(shù)組和單向鏈表實(shí)現(xiàn),數(shù)組中的每個元素都是鏈表专执,由 Node 內(nèi)部類(實(shí)現(xiàn) Map.Entry接口)實(shí)現(xiàn)淮捆,HashMap 通過 put & get 方法存儲和獲取。
存儲對象時本股,將 K/V 鍵值傳給 put() 方法:
①攀痊、調(diào)用 hash(K) 方法計算 K 的 hash 值,然后結(jié)合數(shù)組長度拄显,計算得數(shù)組下標(biāo)苟径;
②、調(diào)整數(shù)組大泄蟆(當(dāng)容器中的元素個數(shù)大于 capacity * loadfactor 時棘街,容器會進(jìn)行擴(kuò)容resize 為 2n);
③承边、i.如果 K 的 hash 值在 HashMap 中不存在遭殉,則執(zhí)行插入,若存在炒刁,則發(fā)生碰撞恩沽;
ii.如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 true翔始,則更新鍵值對罗心;
iii. 如果 K 的 hash 值在 HashMap 中存在,且它們兩者 equals 返回 false城瞎,則插入鏈表的尾部(尾插法)或者紅黑樹中(樹的添加方式)渤闷。
(JDK 1.7 之前使用頭插法、JDK 1.8 使用尾插法)(注意:當(dāng)碰撞導(dǎo)致鏈表大于 TREEIFY_THRESHOLD = 8 時脖镀,就把鏈表轉(zhuǎn)換成紅黑樹)
獲取對象時飒箭,將 K 傳給 get() 方法:①、調(diào)用 hash(K) 方法(計算 K 的 hash 值)從而獲取該鍵值所在鏈表的數(shù)組下標(biāo)蜒灰;②弦蹂、順序遍歷鏈表,equals()方法查找相同 Node 鏈表中 K 值對應(yīng)的 V 值强窖。
hashCode 是定位的凸椿,存儲位置;equals是定性的翅溺,比較兩者是否相等脑漫。
3、當(dāng)兩個對象的 hashCode 相同會發(fā)生什么咙崎?
因?yàn)?hashCode 相同优幸,不一定就是相等的(equals方法比較),所以兩個對象所在數(shù)組的下標(biāo)相同褪猛,"碰撞"就此發(fā)生网杆。又因?yàn)?HashMap 使用鏈表存儲對象,這個 Node 會存儲到鏈表中伊滋。
4碳却、你知道 hash 的實(shí)現(xiàn)嗎?為什么要這樣實(shí)現(xiàn)新啼?
JDK 1.8 中追城,是通過 hashCode() 的高 16 位異或低 16 位實(shí)現(xiàn)的:(h = k.hashCode()) ^ (h >>> 16),主要是從速度燥撞,功效和質(zhì)量來考慮的座柱,減少系統(tǒng)的開銷,也不會造成因?yàn)楦呶粵]有參與下標(biāo)的計算物舒,從而引起的碰撞色洞。
5、為什么要用異或運(yùn)算符冠胯?
保證了對象的 hashCode 的 32 位值只要有一位發(fā)生改變火诸,整個 hash() 返回值就會改變。盡可能的減少碰撞荠察。
6置蜀、HashMap 的 table 的容量如何確定奈搜?loadFactor 是什么?該容量如何變化盯荤?這種變化會帶來什么問題馋吗?
①、table 數(shù)組大小是由 capacity 這個參數(shù)確定的秋秤,默認(rèn)是16宏粤,也可以構(gòu)造時傳入,最大限制是1<<30灼卢;
②绍哎、loadFactor 是裝載因子,主要目的是用來確認(rèn)table 數(shù)組是否需要動態(tài)擴(kuò)展鞋真,默認(rèn)值是0.75崇堰,比如table 數(shù)組大小為 16,裝載因子為 0.75 時灿巧,threshold 就是12赶袄,當(dāng) table 的實(shí)際大小超過 12 時,table就需要動態(tài)擴(kuò)容抠藕;
③饿肺、擴(kuò)容時,調(diào)用 resize() 方法盾似,將 table 長度變?yōu)樵瓉淼膬杀叮ㄗ⒁馐?table 長度敬辣,而不是 threshold)
④、如果數(shù)據(jù)很大的情況下零院,擴(kuò)展時將會帶來性能的損失溉跃,在性能要求很高的地方,這種損失很可能很致命告抄。
7撰茎、HashMap中put方法的過程?
答:“調(diào)用哈希函數(shù)獲取Key對應(yīng)的hash值打洼,再計算其數(shù)組下標(biāo)龄糊;
如果沒有出現(xiàn)哈希沖突,則直接放入數(shù)組募疮;如果出現(xiàn)哈希沖突炫惩,則以鏈表的方式放在鏈表后面;
如果鏈表長度超過閥值( TREEIFY THRESHOLD==8)阿浓,就把鏈表轉(zhuǎn)成紅黑樹他嚷,鏈表長度低于6,就把紅黑樹轉(zhuǎn)回鏈表
如果結(jié)點(diǎn)的key已經(jīng)存在,則替換其value即可筋蓖;
如果集合中的鍵值對大于12卸耘,調(diào)用resize方法進(jìn)行數(shù)組擴(kuò)容∨っ悖”
8鹊奖、數(shù)組擴(kuò)容的過程苛聘?
創(chuàng)建一個新的數(shù)組涂炎,其容量為舊數(shù)組的兩倍,并重新計算舊數(shù)組中結(jié)點(diǎn)的存儲位置设哗。結(jié)點(diǎn)在新數(shù)組中的位置只有兩種唱捣,原下標(biāo)位置或原下標(biāo)+舊數(shù)組的大小。
9网梢、拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替震缭,而選擇紅黑樹?為什么不一直使用紅黑樹战虏?
之所以選擇紅黑樹是為了解決二叉查找樹的缺陷拣宰,二叉查找樹在特殊情況下會變成一條線性結(jié)構(gòu)(這就跟原來使用鏈表結(jié)構(gòu)一樣了,造成很深的問題)烦感,遍歷查找會非常慢巡社。推薦:面試問紅黑樹,我臉都綠了手趣。
而紅黑樹在插入新數(shù)據(jù)后可能需要通過左旋晌该,右旋、變色這些操作來保持平衡绿渣,引入紅黑樹就是為了查找數(shù)據(jù)快朝群,解決鏈表查詢深度的問題,我們知道紅黑樹屬于平衡二叉樹中符,但是為了保持“平衡”是需要付出代價的姜胖,但是該代價所損耗的資源要比遍歷線性鏈表要少,所以當(dāng)長度大于8的時候淀散,會使用紅黑樹右莱,如果鏈表長度很短的話,根本不需要引入紅黑樹吧凉,引入反而會慢隧出。
10、說說你對紅黑樹的見解阀捅?
- 每個節(jié)點(diǎn)非紅即黑
- 根節(jié)點(diǎn)總是黑色的
- 如果節(jié)點(diǎn)是紅色的胀瞪,則它的子節(jié)點(diǎn)必須是黑色的(反之不一定)
- 每個葉子節(jié)點(diǎn)都是黑色的空節(jié)點(diǎn)(NIL節(jié)點(diǎn))
- 從根節(jié)點(diǎn)到葉節(jié)點(diǎn)或空子節(jié)點(diǎn)的每條路徑,必須包含相同數(shù)目的黑色節(jié)點(diǎn)(即相同的黑色高度)
11、jdk8中對HashMap做了哪些改變凄诞?
在java 1.8中圆雁,如果鏈表的長度超過了8,那么鏈表將轉(zhuǎn)換為紅黑樹帆谍。(桶的數(shù)量必須大于64伪朽,小于64的時候只會擴(kuò)容)
發(fā)生hash碰撞時,java 1.7 會在鏈表的頭部插入汛蝙,而java 1.8會在鏈表的尾部插入
在java 1.8中烈涮,Entry被Node替代(換了一個馬甲。
12窖剑、HashMap坚洽,LinkedHashMap,TreeMap 有什么區(qū)別西土?
LinkedHashMap 保存了記錄的插入順序讶舰,在用 Iterator 遍歷時,先取到的記錄肯定是先插入的需了;遍歷比 HashMap 慢跳昼;
TreeMap 實(shí)現(xiàn) SortMap 接口,能夠把它保存的記錄根據(jù)鍵排序(默認(rèn)按鍵值升序排序肋乍,也可以指定排序的比較器)
13鹅颊、HashMap & TreeMap & LinkedHashMap 使用場景?
一般情況下住拭,使用最多的是 HashMap挪略。
HashMap:在 Map 中插入、刪除和定位元素時滔岳;
TreeMap:在需要按自然順序或自定義順序遍歷鍵的情況下杠娱;
LinkedHashMap:在需要輸出的順序和輸入的順序相同的情況下。
*14谱煤、HashMap 和 HashTable 有什么區(qū)別摊求?
①、HashMap 是線程不安全的刘离,HashTable 是線程安全的室叉;
②、由于線程安全硫惕,所以 HashTable 的效率比不上 HashMap茧痕;
③、HashMap最多只允許一條記錄的鍵為null恼除,允許多條記錄的值為null踪旷,而 HashTable不允許曼氛;
④、HashMap 默認(rèn)初始化數(shù)組的大小為16令野,HashTable 為 11舀患,前者擴(kuò)容時,擴(kuò)大兩倍气破,后者擴(kuò)大兩倍+1聊浅;
⑤、HashMap 需要重新計算 hash 值现使,而 HashTable 直接使用對象的 hashCode
15低匙、Java 中的另一個線程安全的與 HashMap 極其類似的類是什么?同樣是線程安全朴下,它與 HashTable 在線程同步上有什么不同努咐?
ConcurrentHashMap 類(是 Java并發(fā)包 java.util.concurrent 中提供的一個線程安全且高效的 HashMap 實(shí)現(xiàn))。
HashTable 是使用 synchronize 關(guān)鍵字加鎖的原理(就是對對象加鎖)殴胧;
而針對 ConcurrentHashMap,在 JDK 1.7 中采用 分段鎖的方式佩迟;JDK 1.8 中直接采用了CAS(無鎖算法)+ synchronized团滥。
16、HashMap & ConcurrentHashMap 的區(qū)別报强?
除了加鎖灸姊,原理上無太大區(qū)別。另外秉溉,HashMap 的鍵值對允許有null力惯,但是ConCurrentHashMap 都不允許。
17召嘶、為什么 ConcurrentHashMap 比 HashTable 效率要高父晶?
HashTable 使用一把鎖(鎖住整個鏈表結(jié)構(gòu))處理并發(fā)問題,多個線程競爭一把鎖弄跌,容易阻塞甲喝;
ConcurrentHashMap
- JDK 1.7 中使用分段鎖(ReentrantLock + Segment + HashEntry),相當(dāng)于把一個 HashMap 分成多個段铛只,每段分配一把鎖埠胖,這樣支持多線程訪問。鎖粒度:基于 Segment淳玩,包含多個 HashEntry直撤。
- JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹。鎖粒度:Node(首結(jié)點(diǎn))(實(shí)現(xiàn) Map.Entry)蜕着。鎖粒度降低了谋竖。
18、針對 ConcurrentHashMap 鎖機(jī)制具體分析(JDK 1.7 VS JDK 1.8)
JDK 1.7 中,采用分段鎖的機(jī)制圈盔,實(shí)現(xiàn)并發(fā)的更新操作豹芯,底層采用數(shù)組+鏈表的存儲結(jié)構(gòu),包括兩個核心靜態(tài)內(nèi)部類 Segment 和 HashEntry驱敲。
①铁蹈、Segment 繼承 ReentrantLock(重入鎖) 用來充當(dāng)鎖的角色,每個 Segment 對象守護(hù)每個散列映射表的若干個桶众眨;
②握牧、HashEntry 用來封裝映射表的鍵-值對;
③娩梨、每個桶是由若干個 HashEntry 對象鏈接起來的鏈表
JDK 1.8 中沿腰,采用Node + CAS + Synchronized來保證并發(fā)安全。取消類 Segment狈定,直接用 table 數(shù)組存儲鍵值對颂龙;當(dāng) HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時,鏈表轉(zhuǎn)換為紅黑樹纽什,提升性能措嵌。底層變更為數(shù)組 + 鏈表 + 紅黑樹。
19芦缰、ConcurrentHashMap 在 JDK 1.8 中企巢,為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock?
①让蕾、粒度降低了浪规;
②、JVM 開發(fā)團(tuán)隊(duì)沒有放棄 synchronized探孝,而且基于 JVM 的 synchronized 優(yōu)化空間更大笋婿,更加自然。
③再姑、在大量的數(shù)據(jù)操作下萌抵,對于 JVM 的內(nèi)存壓力,基于 API 的 ReentrantLock 會開銷更多的內(nèi)存元镀。
20绍填、ConcurrentHashMap 簡單介紹?
①栖疑、重要的常量:
private transient volatile int sizeCtl;
當(dāng)為負(fù)數(shù)時讨永,-1 表示正在初始化,-N 表示 N - 1 個線程正在進(jìn)行擴(kuò)容遇革;
當(dāng)為 0 時卿闹,表示 table 還沒有初始化揭糕;
當(dāng)為其他正數(shù)時,表示初始化或者下一次進(jìn)行擴(kuò)容的大小锻霎。
②著角、數(shù)據(jù)結(jié)構(gòu):
Node 是存儲結(jié)構(gòu)的基本單元,繼承 HashMap 中的 Entry旋恼,用于存儲數(shù)據(jù)吏口;
TreeNode 繼承 Node,但是數(shù)據(jù)結(jié)構(gòu)換成了二叉樹結(jié)構(gòu)冰更,是紅黑樹的存儲結(jié)構(gòu)产徊,用于紅黑樹中存儲數(shù)據(jù);
TreeBin 是封裝 TreeNode 的容器蜀细,提供轉(zhuǎn)換紅黑樹的一些條件和鎖的控制舟铜。
③、存儲對象時(put() 方法):
如果沒有初始化奠衔,就調(diào)用 initTable() 方法來進(jìn)行初始化谆刨;
如果沒有 hash 沖突就直接 CAS 無鎖插入;
如果需要擴(kuò)容涣觉,就先進(jìn)行擴(kuò)容痴荐;
如果存在 hash 沖突,就加鎖來保證線程安全官册,兩種情況:一種是鏈表形式就直接遍歷到尾端插入,一種是紅黑樹就按照紅黑樹結(jié)構(gòu)插入难捌;
如果該鏈表的數(shù)量大于閥值 8膝宁,就要先轉(zhuǎn)換成紅黑樹的結(jié)構(gòu),break 再一次進(jìn)入循環(huán)
如果添加成功就調(diào)用 addCount() 方法統(tǒng)計 size根吁,并且檢查是否需要擴(kuò)容员淫。
④、擴(kuò)容方法 transfer():默認(rèn)容量為 16击敌,擴(kuò)容時介返,容量變?yōu)樵瓉淼膬杀丁?/strong>
helpTransfer():調(diào)用多個工作線程一起幫助進(jìn)行擴(kuò)容,這樣的效率就會更高沃斤。
⑤圣蝎、獲取對象時(get()方法):
計算 hash 值,定位到該 table 索引位置衡瓶,如果是首結(jié)點(diǎn)符合就返回徘公;
如果遇到擴(kuò)容時,會調(diào)用標(biāo)記正在擴(kuò)容結(jié)點(diǎn) ForwardingNode.find()方法哮针,查找該結(jié)點(diǎn)关面,匹配就返回坦袍;
以上都不符合的話,就往下遍歷結(jié)點(diǎn)等太,匹配就返回捂齐,否則最后就返回 null。
21缩抡、ConcurrentHashMap 的并發(fā)度是什么奠宜?
程序運(yùn)行時能夠同時更新 ConccurentHashMap 且不產(chǎn)生鎖競爭的最大線程數(shù)。默認(rèn)為 16缝其,且可以在構(gòu)造函數(shù)中設(shè)置挎塌。
當(dāng)用戶設(shè)置并發(fā)度時,ConcurrentHashMap 會使用大于等于該值的最小2冪指數(shù)作為實(shí)際并發(fā)度(假如用戶設(shè)置并發(fā)度為17内边,實(shí)際并發(fā)度則為32)
原文:cnblogs.com/Young111/p/11519952.html