免責聲明
本文夾雜部分筆者個人觀點,如描述有誤袄秩,歡迎指正
前言
寫這篇文章阵翎,是因為最近研究hashmap源碼的時候,會結合網(wǎng)上的一些博客來促進理解之剧。而關于紅黑樹和鏈表相互轉換這一塊郭卫,大部分的文章都會這樣描述:hashmap中定義了兩個常量:
static final int TREEIFY_THRESHOLD = 8;
static final int UNTREEIFY_THRESHOLD = 6;
當鏈表元素個數(shù)大于8的時候,就會轉換為紅黑樹背稼;當紅黑樹元素個數(shù)小于6的時候贰军,就會轉換回鏈表。
筆者通過仔細觀察,發(fā)現(xiàn)這種說法并不嚴謹词疼。hashMap中確實定義了這兩個常量俯树,但并非簡單通過元素個數(shù)的判斷來進行轉換。
鏈表轉換為紅黑樹
鏈表轉換為紅黑樹的最終目的贰盗,是為了解決在map中元素過多许饿,hash沖突較大,而導致的讀寫效率降低的問題舵盈。在源碼的putVal方法中陋率,有關紅黑樹結構化的分支為:
//此處遍歷鏈表
for (int binCount = 0; ; ++binCount) {
//遍歷到鏈表最后一個節(jié)點
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//如果鏈表元素個數(shù)大于等于TREEIFY_THRESHOLD
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//紅黑樹轉換邏輯
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
即網(wǎng)上所說的,鏈表的長度大于8的時候秽晚,就轉換為紅黑樹瓦糟,我們來看看treeifyBin方法:
final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
//先判斷table的長度是否小于 MIN_TREEIFY_CAPACITY (64)
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
//小于64,則擴容
resize();
else if ((e = tab[index = (n - 1) & hash]) != null) {
//否則才將鏈表轉換為紅黑樹
TreeNode<K,V> hd = null, tl = null;
do {
TreeNode<K,V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;
else {
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
if ((tab[index] = hd) != null)
hd.treeify(tab);
}
}
可以看到在treeifyBin中并不是簡單地將鏈表轉換為紅黑樹赴蝇,而是先判斷table的長度是否大于64菩浙,如果小于64,就通過擴容的方式來解決扯再,避免紅黑樹結構化芍耘。原因呢?筆者個人覺得鏈表長度大于8有兩種情況:
- 1熄阻、table長度足夠斋竞,hash沖突過多
- 2、hash沒有沖突秃殉,但是在計算table下標的時候坝初,由于table長度太小,導致很多hash不一致的key計算的下標一致
第二種情況是可以用擴容的方式來避免的钾军,擴容后鏈表長度變短鳄袍,讀寫效率自然提高。另外吏恭,擴容相對于轉換為紅黑樹的好處在于可以保證數(shù)據(jù)結構更簡單拗小。
由此可見并不是鏈表長度超過8就一定會轉換成紅黑樹,而是先嘗試擴容
紅黑樹轉換為鏈表
基本思想是當紅黑樹中的元素減少并小于一定數(shù)量時樱哼,會切換回鏈表哀九。而元素減少有兩種情況:
- 1、調用map的remove方法刪除元素
hashMap的remove方法搅幅,會進入到removeNode方法阅束,找到要刪除的節(jié)點,并判斷node類型是否為treeNode茄唐,然后進入刪除紅黑樹節(jié)點邏輯的removeTreeNode方法中息裸,該方法有關解除紅黑樹結構的分支如下:
//判斷是否要解除紅黑樹的條件
if (root == null || root.right == null ||
(rl = root.left) == null || rl.left == null) {
tab[index] = first.untreeify(map); // too small
return;
}
可以看到,此處并沒有利用到網(wǎng)上所說的,當節(jié)點數(shù)小于UNTREEIFY_THRESHOLD時才轉換呼盆,而是通過紅黑樹根節(jié)點及其子節(jié)點是否為空來判斷年扩。而滿足該條件的最大紅黑樹結構如下:
節(jié)點數(shù)為10,大于 UNTREEIFY_THRESHOLD(6)宿亡,但是根據(jù)該方法的邏輯判斷常遂,是需要轉換為鏈表的
- 2纳令、resize的時候挽荠,對紅黑樹進行了拆分
resize的時候,判斷節(jié)點類型平绩,如果是鏈表圈匆,則將鏈表拆分,如果是TreeNode捏雌,則執(zhí)行TreeNode的split方法分割紅黑樹跃赚,而split方法中將紅黑樹轉換為鏈表的分支如下:
//在這之前的邏輯是將紅黑樹每個節(jié)點的hash和一個bit進行&運算,
//根據(jù)運算結果將樹劃分為兩棵紅黑樹性湿,lc表示其中一棵樹的節(jié)點數(shù)
if (lc <= UNTREEIFY_THRESHOLD)
tab[index] = loHead.untreeify(map);
else {
tab[index] = loHead;
if (hiHead != null) // (else is already treeified)
loHead.treeify(tab);
}
這里才用到了 UNTREEIFY_THRESHOLD 的判斷纬傲,當紅黑樹節(jié)點元素小于等于6時,才調用untreeify方法轉換回鏈表
總結
- 1肤频、hashMap并不是在鏈表元素個數(shù)大于8就一定會轉換為紅黑樹叹括,而是先考慮擴容,擴容達到默認限制后才轉換
- 2宵荒、hashMap的紅黑樹不一定小于6的時候才會轉換為鏈表汁雷,而是只有在resize的時候才會根據(jù) UNTREEIFY_THRESHOLD 進行轉換。(原因报咳?不太明白hhh)