Spark內(nèi)存管理功能概述 & 對(duì)Unroll Memory的理解

談到Spark內(nèi)存管理拆祈,估計(jì)大家都會(huì)想到:static memory manager,unified memory manager倘感,execution memory放坏,storage memory,tungsten, task memory manager等一系列模塊老玛。網(wǎng)絡(luò)上介紹這些模塊的文章已經(jīng)非常多淤年,筆者不想一個(gè)個(gè)地系統(tǒng)介紹,只想"漫不經(jīng)心"地談?wù)勂綍r(shí)思考過(guò)的關(guān)于spark內(nèi)存管理的一些問(wèn)題蜡豹,比如:

1. Spark的內(nèi)存管理與JVM的內(nèi)存分配回收機(jī)制有什么區(qū)別和聯(lián)系麸粮?哪些事是spark內(nèi)存管理做的,哪些事是JVM做的镜廉?

2. Spark中用到內(nèi)存的地方有哪些弄诲?存儲(chǔ)內(nèi)存主要消耗在哪些地方?執(zhí)行內(nèi)存主要消耗在哪些地方娇唯?

3. Spark程序出現(xiàn)OOM的可能原因有哪些齐遵?除了用戶(hù)代碼外寂玲,Spark自身框架有哪些環(huán)節(jié)可能出現(xiàn)OOM?

4. Tungsten在內(nèi)存優(yōu)化方面都做了些什么梗摇??jī)?yōu)化了spark的哪些環(huán)節(jié)拓哟?

在“漫談”的過(guò)程中,筆者會(huì)結(jié)合源碼留美,針對(duì)筆者認(rèn)為有必要說(shuō)明的一些問(wèn)題做細(xì)節(jié)分析彰檬。

1 Spark內(nèi)存管理都做了些啥伸刃?

我們知道JVM有自己的內(nèi)存模型和內(nèi)存分配回收機(jī)制谎砾,它會(huì)負(fù)責(zé)與操作系統(tǒng)交互進(jìn)行內(nèi)存的申請(qǐng)和釋放等。那么捧颅,Spark內(nèi)存管理又做了什么呢景图?筆者覺(jué)得它主要做了三件事:

1. 在JVM之上搭建了一套邏輯上的內(nèi)存管理機(jī)制,在spark的存儲(chǔ)和執(zhí)行框架使用JVM堆內(nèi)存之前確保有足夠內(nèi)存空間碉哑。當(dāng)內(nèi)存空間不足時(shí)挚币,spark memory manager的各個(gè)調(diào)用模塊會(huì)采取相應(yīng)的措施,比如ExternalSorter會(huì)在內(nèi)存中不足時(shí)將數(shù)據(jù)spill到disk上扣典。

2. Tungsten構(gòu)建了一套類(lèi)似操作系統(tǒng)內(nèi)存頁(yè)管理的機(jī)制妆毕,用MemoryBlock表示一個(gè)內(nèi)存頁(yè),用自己的page table進(jìn)行管理贮尖,實(shí)現(xiàn)了類(lèi)似操作系統(tǒng)中的虛擬內(nèi)存邏輯地址笛粘,對(duì)(pageNumber, offsetInPage)進(jìn)行編碼生成邏輯地址,統(tǒng)一了on heap和off heap內(nèi)存的訪(fǎng)問(wèn)方式湿硝。

3. Tungsten在off heap模式下會(huì)繞過(guò)JVM使用sun.misc.Unsafe的API直接與操作系統(tǒng)交互薪前,進(jìn)行內(nèi)存的申請(qǐng)和釋放,從而免除了創(chuàng)建JVM對(duì)象帶來(lái)的額外內(nèi)存開(kāi)銷(xiāo)以及GC對(duì)性能的影響关斜。

1.1 Memory Manager

上面#1中的事情主要由MemoryManager (StaticMemoryManager或UnifiedMemoryManager)負(fù)責(zé)示括,它會(huì)利用不同的MemoryPool將內(nèi)存按功能和性質(zhì)區(qū)分開(kāi)來(lái),包括堆內(nèi)存儲(chǔ)內(nèi)存池痢畜,堆外存儲(chǔ)內(nèi)存池垛膝,堆內(nèi)執(zhí)行內(nèi)存池,堆外執(zhí)行內(nèi)存池:

4 memory pools in MemoryManager

memoryPool記錄了內(nèi)存使用狀態(tài)的各項(xiàng)metrics丁稀,比如最大內(nèi)存吼拥,可用內(nèi)存,已用內(nèi)存等二驰。

MemoryManager提供了幾個(gè)方法供調(diào)用者使用以申請(qǐng)和釋放指定類(lèi)型的內(nèi)存空間:

methods for acquiring and releasing memory in MemoryManager

unroll memory是什么扔罪?

這里重點(diǎn)講一下unroll memory的概念,在《Spark SQL內(nèi)核剖析》上看到對(duì)"unroll"的定義:“將partition由不連續(xù)的存儲(chǔ)空間轉(zhuǎn)換為連續(xù)的存儲(chǔ)空間的過(guò)程”桶雀。

為了說(shuō)明這個(gè)問(wèn)題矿酵,我們先來(lái)看看acquireUnrollMemory方法的一個(gè)調(diào)用全過(guò)程:

ShuffleMapTask/ResultTask.runTask -> RDD.iterator -> RDD.getOrCompute -> BlockManager.getOrElseUpdate -> BlockManager.doPutIterator -> MemoryStore.putIteratorAsBytes -> MemoryStore.putIterator -> MemoryStore.reserveUnrollMemoryForThisTask -> MemoryManager.acquireUnrollMemory

可以看到唬复,task(shuffle map task和result task)執(zhí)行時(shí)調(diào)用RDD.iterator獲取指定partition的數(shù)據(jù)迭代器,這個(gè)過(guò)程中的MemoryStore.putIterator會(huì)遍歷指定partition的所有records全肮,獲取每個(gè)value并將其存放在連續(xù)內(nèi)存中:

MemoryStore.putIterator

因?yàn)槭怯玫饕粭l一條record獲取的敞咧,事先并不知道是否有足夠內(nèi)存存放下partition的所有數(shù)據(jù),所以這里的步驟是這樣的:

1. 先向memoryManager申請(qǐng)一份unroll內(nèi)存(初始大小由參數(shù)spark.storage.unrollMemoryThreshold控制辜腺,默認(rèn)為1mb)休建;

2. 然后每讀一條record都會(huì)評(píng)估一下當(dāng)前所需內(nèi)存是否超過(guò)已分配內(nèi)存,如果超過(guò)评疗,則向memoryManager申請(qǐng)額外需要的內(nèi)存测砂。如果申請(qǐng)成功,則繼續(xù)讀取下一個(gè)record百匆,否則就停止unroll砌些,即存儲(chǔ)partition到內(nèi)存失敗。

loop of reading record in MemoryStore.putIterator

3. 重復(fù)步驟#2加匈,直到partition所有數(shù)據(jù)都成功unroll存璃,或因內(nèi)存不足而停止unroll.

4. 如果partition所有數(shù)據(jù)都成功unroll,則將unroll memory轉(zhuǎn)化成storage memory :

transfer unroll memory to storage memory in MemoryStore.putIterator

可以看到雕拼,最終會(huì)release unroll memory并申請(qǐng)storage memory. 我們看一下UnifiedMemoryManager中acquireUnrollMemory和MemoryManager中releaseUnrollMemory的實(shí)現(xiàn):

UnifiedMemoryManager.acquireUnrollMemory
MemoryManager.releaseUnrollMemory

可以看到纵东,其實(shí)unroll memory和storage memory的申請(qǐng)及釋放調(diào)用的是同樣的方法。

筆者對(duì)unroll memory的理解是:unroll memory和storage memory本質(zhì)上是同一份內(nèi)存啥寇,只是在任務(wù)執(zhí)行的不同階段的不同邏輯表述形式偎球。在partition數(shù)據(jù)的讀取存儲(chǔ)過(guò)程中,這份內(nèi)存叫做unroll memory示姿,而當(dāng)成功讀取存儲(chǔ)了所有reocrd到內(nèi)存中后甜橱,這份內(nèi)存就改了個(gè)名字叫storage memory了。

注意栈戳,unroll memory的概念只存在于spark的存儲(chǔ)模塊中岂傲,在執(zhí)行模塊中是不存在unroll memory的。

不知不覺(jué)已經(jīng)寫(xiě)了不少字子檀,今天先談到這镊掖,未完待續(xù)。

說(shuō)明

1. 本文內(nèi)容及源碼均基于spark 2.4.0之前版本

2. 水平有限褂痰,有誤之處望讀者指出

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末亩进,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子缩歪,更是在濱河造成了極大的恐慌归薛,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,539評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異主籍,居然都是意外死亡习贫,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門(mén)千元,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)苫昌,“玉大人,你說(shuō)我怎么就攤上這事幸海∷钌恚” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,871評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵物独,是天一觀的道長(zhǎng)袜硫。 經(jīng)常有香客問(wèn)我,道長(zhǎng)议纯,這世上最難降的妖魔是什么父款? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,963評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮瞻凤,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘世杀。我一直安慰自己阀参,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,984評(píng)論 6 393
  • 文/花漫 我一把揭開(kāi)白布瞻坝。 她就那樣靜靜地躺著蛛壳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪所刀。 梳的紋絲不亂的頭發(fā)上衙荐,一...
    開(kāi)封第一講書(shū)人閱讀 51,763評(píng)論 1 307
  • 那天,我揣著相機(jī)與錄音浮创,去河邊找鬼忧吟。 笑死,一個(gè)胖子當(dāng)著我的面吹牛斩披,可吹牛的內(nèi)容都是我干的溜族。 我是一名探鬼主播,決...
    沈念sama閱讀 40,468評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼垦沉,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼煌抒!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起厕倍,我...
    開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤寡壮,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體况既,經(jīng)...
    沈念sama閱讀 45,850評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡屋群,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,002評(píng)論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了坏挠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片芍躏。...
    茶點(diǎn)故事閱讀 40,144評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖降狠,靈堂內(nèi)的尸體忽然破棺而出对竣,到底是詐尸還是另有隱情,我是刑警寧澤榜配,帶...
    沈念sama閱讀 35,823評(píng)論 5 346
  • 正文 年R本政府宣布否纬,位于F島的核電站,受9級(jí)特大地震影響蛋褥,放射性物質(zhì)發(fā)生泄漏临燃。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,483評(píng)論 3 331
  • 文/蒙蒙 一烙心、第九天 我趴在偏房一處隱蔽的房頂上張望膜廊。 院中可真熱鬧,春花似錦淫茵、人聲如沸爪瓜。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,026評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)铆铆。三九已至,卻和暖如春丹喻,著一層夾襖步出監(jiān)牢的瞬間薄货,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,150評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工碍论, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留谅猾,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,415評(píng)論 3 373
  • 正文 我出身青樓骑冗,卻偏偏與公主長(zhǎng)得像赊瞬,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子贼涩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,092評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容