【Scala】Vector內(nèi)部結(jié)構(gòu)與內(nèi)存共享原理

Scala不可變集合

Scala不可變集合的設(shè)計(jì)目標(biāo)是提供高效又安全的實(shí)現(xiàn)。這些集合中的大部分都是用高級(jí)技巧來在集合的不同版本之間“共享”內(nèi)存量淌。其中較長(zhǎng)使用到的是Vector和List骗村。
在一般的編程任務(wù)中,不可變集合有很多超出可變集合的優(yōu)點(diǎn)类少。尤其重要的一點(diǎn)是不可變集合可以在多線程之中共享而無需加鎖叙身。

Vector內(nèi)部結(jié)構(gòu)

Scala的Vector實(shí)現(xiàn)為一組嵌套數(shù)組,在分割和連接時(shí)非常有效率硫狞。適用于大部分通用算法信轿,因?yàn)樗懈咝У南聵?biāo)計(jì)算能力,以及能夠在使用像+:和++方法時(shí)共享大部分內(nèi)部結(jié)構(gòu)的能力残吩。
Vector采用分支系數(shù)為32的樹狀數(shù)據(jù)結(jié)構(gòu)财忽,分支因子是每個(gè)父節(jié)點(diǎn)允許擁有的最大子節(jié)點(diǎn)的數(shù)目。其隨機(jī)訪問(搜索或修改)復(fù)雜度是log_32(N)泣侮,使用32位整數(shù)下標(biāo)時(shí)在JVM上是個(gè)效率不錯(cuò)的小常量即彪,即使對(duì)很大的N來說都近似一個(gè)常量。
Vector是個(gè)由元素的下標(biāo)組成的前綴樹(trie),前綴樹是給定路徑上的所有子節(jié)點(diǎn)功用某種形式的公共鍵值隶校。我們可以根據(jù)任何下標(biāo)的二進(jìn)制形式得到查找路徑漏益,實(shí)現(xiàn)高效的元素查找。

Vector復(fù)制過程中的結(jié)構(gòu)共享原理

在實(shí)際應(yīng)用中深胳,為了保持變量的不可變性绰疤,對(duì)有用的集合進(jìn)行復(fù)制通常是必要的。假設(shè)有一個(gè)包含100 000個(gè)元素的Vector舞终,需要得到一個(gè)副本轻庆,并替換掉原Vector的第8個(gè)元素,此時(shí)如果構(gòu)造一個(gè)全新的100 000個(gè)元素的Vector將會(huì)是極其低效的敛劝。
為了兼顧高效和不可變性余爆,可以通過共享原始Vector中的不變部分,而以某種方式表示變化部分夸盟,那么就可以高效地“創(chuàng)建”新Vector了蛾方。這種思想稱之為結(jié)構(gòu)共享

如果其他線程中的代碼正在對(duì)原始Vector做其他不同的操作满俗,對(duì)原始的Vector的復(fù)制不會(huì)影響該操作转捕,因?yàn)樵璙ector沒有被修改。這樣唆垃,只要對(duì)舊版本有一個(gè)或多個(gè)引用,就可以創(chuàng)建一個(gè)Vector的“歷史”版本痘儡。直到對(duì)舊版本的引用消失為止辕万,舊版本才會(huì)被垃圾回收。

下面的圖示解釋了創(chuàng)建并修改副本過程中結(jié)構(gòu)共享的原理:
使用#1來引用原樹的根節(jié)點(diǎn):



現(xiàn)在假設(shè)要在2和3之間插入2.5沉删,要?jiǎng)?chuàng)建一個(gè)新的副本渐尿,我們并不需要修改原來的樹結(jié)構(gòu),而是創(chuàng)建新樹矾瑰。
值得注意的是砖茸,原來的樹(#1)仍然存在,但我們又創(chuàng)建了新的根(#2)和新的節(jié)點(diǎn)殴穴。創(chuàng)建新的樹共享重用了原來的大部分節(jié)點(diǎn)凉夯,這樣有助于降低修改集合的開銷。


Vector查找原理

Scala的Vector集合非常類似于一個(gè)分支系數(shù)為32的下標(biāo)前綴樹采幌。關(guān)鍵區(qū)別在于Vector用一個(gè)數(shù)組來表示分支劲够。這使整個(gè)結(jié)構(gòu)變成數(shù)組的數(shù)組(嵌套數(shù)組)。
下圖是分支系數(shù)為2的二進(jìn)制Vector:


其中有三個(gè)基本素組:display0休傍、display1和display2.這些數(shù)組代表原始前綴樹的深度征绎。每個(gè)顯示元素(display element)都是一個(gè)更深一層的的嵌套數(shù)組(display0是元素的數(shù)組,display1是數(shù)組的數(shù)組磨取,display2是數(shù)組的數(shù)組的數(shù)組)人柿。查找集合元素的步驟是先判斷其深度柴墩,然后用跟前綴樹一樣的方式確定元素所在的數(shù)組。比如找數(shù)字4凫岖,其深度為2江咳,所以先選擇display2數(shù)組,4的二進(jìn)制形式100隘截,所以外層數(shù)組是下標(biāo)為1的位置上扎阶,中層數(shù)組下標(biāo)為0,最后4就位于結(jié)果數(shù)組的下標(biāo)0的位置上婶芭。

二進(jìn)制前綴樹根據(jù)下標(biāo)隨機(jī)取值的復(fù)雜度是log_2(n)东臀,Scala的Vector的分支系數(shù)為32,那么訪問任何元素的時(shí)間復(fù)雜度是log_32(n)犀农,對(duì)32位的下標(biāo)也就大約是7惰赋,對(duì)64位大約是13.而對(duì)于較小的集合,排序的開銷也會(huì)降低呵哨,所以訪問速度會(huì)更快赁濒。所以隨機(jī)訪問的時(shí)間復(fù)雜度與前綴樹的大小成正比孟害。

小結(jié)

Scala的Vector為32分支,這除了帶來查找時(shí)間和修改時(shí)間可以隨集合大小伸縮外挨务,它還提供了不錯(cuò)的緩存一致性,因?yàn)榧侠锵嘟脑赜泻艽罂赡芪挥谕粋€(gè)內(nèi)存數(shù)組里丁侄。其高效結(jié)合不可變所帶來的線程安全使之成為庫(kù)里最強(qiáng)大的有序集合朝巫。
Scala的序列類型中Vector和List數(shù)據(jù)結(jié)構(gòu)都是很常用的,Vector的所有操作都是O(1)(常數(shù)時(shí)間)劈猿,而List對(duì)于那些需要訪問頭部以為元素的操作都需要O(n)操作,所以只在頻繁執(zhí)行頭尾分解的情況下庐镐,推薦使用List变逃。

轉(zhuǎn)載請(qǐng)注明作者Jason Ding及其出處
jasonding.top
Github博客主頁(yè)(http://blog.jasonding.top/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡(jiǎn)書主頁(yè)(http://www.reibang.com/users/2bd9b48f6ea8/latest_articles)
Google搜索jasonding1354進(jìn)入我的博客主頁(yè)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市名眉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌损拢,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,589評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件掏秩,死亡現(xiàn)場(chǎng)離奇詭異荆姆,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)胆筒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,615評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門仆救,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人彤蔽,你說我怎么就攤上這事《倩荆” “怎么了?”我有些...
    開封第一講書人閱讀 165,933評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)撕阎。 經(jīng)常有香客問我碌补,道長(zhǎng)虏束,這世上最難降的妖魔是什么厦章? 我笑而不...
    開封第一講書人閱讀 58,976評(píng)論 1 295
  • 正文 為了忘掉前任袜啃,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘发乔。我一直安慰自己,他們只是感情好栏尚,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,999評(píng)論 6 393
  • 文/花漫 我一把揭開白布只恨。 她就那樣靜靜地躺著官觅,像睡著了一般。 火紅的嫁衣襯著肌膚如雪产艾。 梳的紋絲不亂的頭發(fā)上闷堡,一...
    開封第一講書人閱讀 51,775評(píng)論 1 307
  • 那天杠览,我揣著相機(jī)與錄音纵势,去河邊找鬼钦铁。 笑死,一個(gè)胖子當(dāng)著我的面吹牛佛点,可吹牛的內(nèi)容都是我干的黎比。 我是一名探鬼主播,決...
    沈念sama閱讀 40,474評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼演闭,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼颓帝!你這毒婦竟也來了窝革?” 一聲冷哼從身側(cè)響起见间,我...
    開封第一講書人閱讀 39,359評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤米诉,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后拴泌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蚪腐,經(jīng)...
    沈念sama閱讀 45,854評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡回季,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,007評(píng)論 3 338
  • 正文 我和宋清朗相戀三年泡一,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了觅廓。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鼻忠。...
    茶點(diǎn)故事閱讀 40,146評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡帖蔓,死狀恐怖瞳脓,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情劫侧,我是刑警寧澤,帶...
    沈念sama閱讀 35,826評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站劲弦,受9級(jí)特大地震影響醇坝,放射性物質(zhì)發(fā)生泄漏次坡。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,484評(píng)論 3 331
  • 文/蒙蒙 一砸琅、第九天 我趴在偏房一處隱蔽的房頂上張望轴踱。 院中可真熱鬧,春花似錦诱篷、人聲如沸雳灵。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,029評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽躲撰。三九已至,卻和暖如春茴肥,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背瞬铸。 一陣腳步聲響...
    開封第一講書人閱讀 33,153評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工础锐, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人拦宣。 一個(gè)月前我還...
    沈念sama閱讀 48,420評(píng)論 3 373
  • 正文 我出身青樓信姓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親意推。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,107評(píng)論 2 356

推薦閱讀更多精彩內(nèi)容

  • scala學(xué)習(xí)筆記 第2章 變量和數(shù)據(jù)類型 基本數(shù)據(jù) scala的核心數(shù)據(jù)為四種 :字面量育灸、值昵宇、變量、類型 值使...
    485b1aca799e閱讀 2,128評(píng)論 0 1
  • 53.計(jì)算字符 在字符串中獲取字符值的數(shù)量, 可以使用字符串字符屬性中的計(jì)數(shù)屬性: let unusualMena...
    無灃閱讀 1,093評(píng)論 0 4
  • 在平時(shí)使用集合的時(shí)候砸喻,我們經(jīng)常會(huì)選擇 Scala 中通用的集合杭煎,例如:Seq、Map蜂桶、List等等也切,有的時(shí)候選擇「...
    ShawRain閱讀 1,098評(píng)論 0 0
  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法扑媚,類相關(guān)的語法雷恃,內(nèi)部類的語法,繼承相關(guān)的語法旬痹,異常的語法,線程的語...
    子非魚_t_閱讀 31,645評(píng)論 18 399
  • 過有序生活 孩子第二個(gè)30天目標(biāo):學(xué)會(huì)自己安排時(shí)間 媽媽第二個(gè)30天目標(biāo):吃飯細(xì)嚼慢咽 加油(潘也齊+7)踐行打卡...
    chenlan_c55e閱讀 151評(píng)論 0 0