阿里面試題:為什么Map桶中個數(shù)超過8才轉(zhuǎn)為樹

歡迎關(guān)注筆者的公眾號:【阿飛的博客】壶唤,首發(fā)都在這里!W厮闸盔!

這是筆者一個好友面試阿里時,被問及的一個問題琳省,應(yīng)該不少人看到這個問題都會一面懵逼迎吵。因為,大部分的文章都是分析鏈表是怎么轉(zhuǎn)換成紅黑樹的针贬,但是并沒有說明為什么當(dāng)鏈表長度為8的時候才做轉(zhuǎn)換動作击费。筆者第一反應(yīng)也是一樣,只能初略的猜測是因為時間和空間的權(quán)衡坚踩。

要弄明白這個問題荡灾,我們首先要明白為什么要轉(zhuǎn)換瓤狐,這個問題比較簡單瞬铸,因為Map中桶的元素初始化是鏈表保存的,其查找性能是O(n)础锐,而樹結(jié)構(gòu)能將查找性能提升到O(log(n))嗓节。當(dāng)鏈表長度很小的時候,即使遍歷皆警,速度也非忱剐快,但是當(dāng)鏈表長度不斷變長信姓,肯定會對查詢性能有一定的影響鸵隧,所以才需要轉(zhuǎn)成樹。至于為什么閾值是8意推,我想豆瘫,去源碼中找尋答案應(yīng)該是最可靠的途徑。

8這個閾值定義在HashMap中菊值,如下所示外驱,這段注釋只說明了8是bin(bin就是bucket育灸,即HashMap中hashCode值一樣的元素保存的地方)從鏈表轉(zhuǎn)成樹的閾值,但是并沒有說明為什么是8:

/**
 * The bin count threshold for using a tree rather than list for a
 * bin.  Bins are converted to trees when adding an element to a
 * bin with at least this many nodes. The value must be greater
 * than 2 and should be at least 8 to mesh with assumptions in
 * tree removal about conversion back to plain bins upon shrinkage.
 */
static final int TREEIFY_THRESHOLD = 8;

我們繼續(xù)往下看昵宇,在HashMap中有一段Implementation notes磅崭,筆者摘錄了幾段重要的描述,第一段如下所示瓦哎,大概含義是當(dāng)bin變得很大的時候砸喻,就會被轉(zhuǎn)換成TreeNodes中的bin,其結(jié)構(gòu)和TreeMap相似杭煎,也就是紅黑樹:

This map usually acts as a binned (bucketed) hash table, but
when bins get too large, they are transformed into bins of TreeNodes,
each structured similarly to those in java.util.TreeMap

繼續(xù)往下看恩够,TreeNodes占用空間是普通Nodes的兩倍,所以只有當(dāng)bin包含足夠多的節(jié)點時才會轉(zhuǎn)成TreeNodes羡铲,而是否足夠多就是由TREEIFY_THRESHOLD的值決定的蜂桶。當(dāng)bin中節(jié)點數(shù)變少時,又會轉(zhuǎn)成普通的bin也切。并且我們查看源碼的時候發(fā)現(xiàn)扑媚,鏈表長度達到8就轉(zhuǎn)成紅黑樹,當(dāng)長度降到6就轉(zhuǎn)成普通bin雷恃。

這樣就解析了為什么不是一開始就將其轉(zhuǎn)換為TreeNodes疆股,而是需要一定節(jié)點數(shù)才轉(zhuǎn)為TreeNodes,說白了就是trade-off倒槐,空間和時間的權(quán)衡:

Because TreeNodes are about twice the size of regular nodes, we
use them only when bins contain enough nodes to warrant use
(see TREEIFY_THRESHOLD). And when they become too small (due to
removal or resizing) they are converted back to plain bins.  In
usages with well-distributed user hashCodes, tree bins are
rarely used.  Ideally, under random hashCodes, the frequency of
nodes in bins follows a Poisson distribution
(http://en.wikipedia.org/wiki/Poisson_distribution) with a
parameter of about 0.5 on average for the default resizing
threshold of 0.75, although with a large variance because of
resizing granularity. Ignoring variance, the expected
occurrences of list size k are (exp(-0.5)*pow(0.5, k)/factorial(k)). 
The first values are:
0:    0.60653066
1:    0.30326533
2:    0.07581633
3:    0.01263606
4:    0.00157952
5:    0.00015795
6:    0.00001316
7:    0.00000094
8:    0.00000006
more: less than 1 in ten million

這段內(nèi)容還說到:當(dāng)hashCode離散性很好的時候旬痹,樹型bin用到的概率非常小,因為數(shù)據(jù)均勻分布在每個bin中讨越,幾乎不會有bin中鏈表長度會達到閾值两残。但是在隨機hashCode下,離散性可能會變差把跨,然而JDK又不能阻止用戶實現(xiàn)這種不好的hash算法人弓,因此就可能導(dǎo)致不均勻的數(shù)據(jù)分布。不過理想情況下隨機hashCode算法下所有bin中節(jié)點的分布頻率會遵循泊松分布着逐,我們可以看到崔赌,一個bin中鏈表長度達到8個元素的概率為0.00000006,幾乎是不可能事件耸别。所以健芭,之所以選擇8,不是拍拍屁股決定的秀姐,而是根據(jù)概率統(tǒng)計決定的慈迈。由此可見,發(fā)展30年的Java每一項改動和優(yōu)化都是非常嚴謹和科學(xué)的囊扳。

  • 畫外音

筆者通過搜索引擎搜索這個問題吩翻,發(fā)現(xiàn)很多下面這個答案(猜測也是相互轉(zhuǎn)發(fā)):

紅黑樹的平均查找長度是log(n)兜看,如果長度為8,平均查找長度為log(8)=3狭瞎,鏈表的平均查找長度為n/2细移,當(dāng)長度為8時,平均查找長度為8/2=4熊锭,這才有轉(zhuǎn)換成樹的必要弧轧;鏈表長度如果是小于等于6,6/2=3碗殷,而log(6)=2.6精绎,雖然速度也很快的,但是轉(zhuǎn)化為樹結(jié)構(gòu)和生成樹的時間并不會太短锌妻。

筆者認為這個答案不夠嚴謹:3相比4有轉(zhuǎn)換的必要代乃,而2.6相比3就沒有轉(zhuǎn)換的必要?起碼我不敢茍同仿粹。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末搁吓,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子吭历,更是在濱河造成了極大的恐慌堕仔,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,383評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件晌区,死亡現(xiàn)場離奇詭異摩骨,居然都是意外死亡,警方通過查閱死者的電腦和手機朗若,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評論 3 385
  • 文/潘曉璐 我一進店門恼五,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人捡偏,你說我怎么就攤上這事唤冈∠棵裕” “怎么了银伟?”我有些...
    開封第一講書人閱讀 157,852評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長绘搞。 經(jīng)常有香客問我彤避,道長,這世上最難降的妖魔是什么夯辖? 我笑而不...
    開封第一講書人閱讀 56,621評論 1 284
  • 正文 為了忘掉前任琉预,我火速辦了婚禮,結(jié)果婚禮上蒿褂,老公的妹妹穿的比我還像新娘圆米。我一直安慰自己卒暂,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,741評論 6 386
  • 文/花漫 我一把揭開白布娄帖。 她就那樣靜靜地躺著也祠,像睡著了一般。 火紅的嫁衣襯著肌膚如雪近速。 梳的紋絲不亂的頭發(fā)上诈嘿,一...
    開封第一講書人閱讀 49,929評論 1 290
  • 那天,我揣著相機與錄音削葱,去河邊找鬼奖亚。 笑死,一個胖子當(dāng)著我的面吹牛析砸,可吹牛的內(nèi)容都是我干的昔字。 我是一名探鬼主播,決...
    沈念sama閱讀 39,076評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼首繁,長吁一口氣:“原來是場噩夢啊……” “哼李滴!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蛮瞄,我...
    開封第一講書人閱讀 37,803評論 0 268
  • 序言:老撾萬榮一對情侶失蹤所坯,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后挂捅,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體芹助,經(jīng)...
    沈念sama閱讀 44,265評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,582評論 2 327
  • 正文 我和宋清朗相戀三年闲先,在試婚紗的時候發(fā)現(xiàn)自己被綠了状土。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,716評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡伺糠,死狀恐怖蒙谓,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情训桶,我是刑警寧澤累驮,帶...
    沈念sama閱讀 34,395評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站舵揭,受9級特大地震影響谤专,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜午绳,卻給世界環(huán)境...
    茶點故事閱讀 40,039評論 3 316
  • 文/蒙蒙 一置侍、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦蜡坊、人聲如沸杠输。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽抬伺。三九已至,卻和暖如春灾梦,著一層夾襖步出監(jiān)牢的瞬間峡钓,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評論 1 266
  • 我被黑心中介騙來泰國打工若河, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留能岩,地道東北人。 一個月前我還...
    沈念sama閱讀 46,488評論 2 361
  • 正文 我出身青樓萧福,卻偏偏與公主長得像拉鹃,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子鲫忍,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,612評論 2 350

推薦閱讀更多精彩內(nèi)容

  • 看一部老電影膏燕,猶如恰遇一位老友,總能將你帶回那些沉睡的歲月悟民,體會到那個時代的繁榮與滄桑坝辫。今天小編就為大家?guī)韮刹坷?..
    來自芒果鎮(zhèn)的小影閱讀 384評論 0 0
  • 年關(guān)將近智润,也不知道為什么及舍,總感覺有點苦悶。 親朋好友電話催了好幾次了窟绷,可就是動搖不了我“漂泊他鄉(xiāng)”的心锯玛,距離上次回...
    為什么是我呢閱讀 337評論 2 6
  • 開課貓團隊長打造營結(jié)束,感觸頗深兼蜈,感謝花花老大給我提供這次學(xué)習(xí)的機會攘残,又是一次成長的經(jīng)歷。七天一群陌生人組建成一個...
    F云兒閱讀 142評論 0 0
  • 春風(fēng)又綠江南献宫,多少樓臺煙雨中钥平,從陽臺望見一灣碧水之畔,楊柳依依。 下樓涉瘾,見那一排紅葉李已開得一樹繁花知态,沒忍住,折得...
    流年飛螢閱讀 523評論 1 7