Spark內(nèi)存管理功能概述 & 對(duì)Unroll Memory的理解

談到Spark內(nèi)存管理拆祈，估計(jì)大家都會(huì)想到：static memory manager，unified memory manager倘感，execution memory放坏，storage memory，tungsten, task memory manager等一系列模塊老玛。網(wǎng)絡(luò)上介紹這些模塊的文章已經(jīng)非常多淤年，筆者不想一個(gè)個(gè)地系統(tǒng)介紹，只想"漫不經(jīng)心"地談?wù)勂綍r(shí)思考過(guò)的關(guān)于spark內(nèi)存管理的一些問(wèn)題蜡豹，比如：

1. Spark的內(nèi)存管理與JVM的內(nèi)存分配回收機(jī)制有什么區(qū)別和聯(lián)系麸粮？哪些事是spark內(nèi)存管理做的，哪些事是JVM做的镜廉？

2. Spark中用到內(nèi)存的地方有哪些弄诲？存儲(chǔ)內(nèi)存主要消耗在哪些地方？執(zhí)行內(nèi)存主要消耗在哪些地方娇唯？

3. Spark程序出現(xiàn)OOM的可能原因有哪些齐遵？除了用戶(hù)代碼外寂玲，Spark自身框架有哪些環(huán)節(jié)可能出現(xiàn)OOM？

4. Tungsten在內(nèi)存優(yōu)化方面都做了些什么梗摇？?jī)?yōu)化了spark的哪些環(huán)節(jié)拓哟？

在“漫談”的過(guò)程中，筆者會(huì)結(jié)合源碼留美，針對(duì)筆者認(rèn)為有必要說(shuō)明的一些問(wèn)題做細(xì)節(jié)分析彰檬。

1 Spark內(nèi)存管理都做了些啥伸刃？

我們知道JVM有自己的內(nèi)存模型和內(nèi)存分配回收機(jī)制谎砾，它會(huì)負(fù)責(zé)與操作系統(tǒng)交互進(jìn)行內(nèi)存的申請(qǐng)和釋放等。那么捧颅，Spark內(nèi)存管理又做了什么呢景图？筆者覺(jué)得它主要做了三件事：

1. 在JVM之上搭建了一套邏輯上的內(nèi)存管理機(jī)制，在spark的存儲(chǔ)和執(zhí)行框架使用JVM堆內(nèi)存之前確保有足夠內(nèi)存空間碉哑。當(dāng)內(nèi)存空間不足時(shí)挚币，spark memory manager的各個(gè)調(diào)用模塊會(huì)采取相應(yīng)的措施，比如ExternalSorter會(huì)在內(nèi)存中不足時(shí)將數(shù)據(jù)spill到disk上扣典。

2. Tungsten構(gòu)建了一套類(lèi)似操作系統(tǒng)內(nèi)存頁(yè)管理的機(jī)制妆毕，用MemoryBlock表示一個(gè)內(nèi)存頁(yè)，用自己的page table進(jìn)行管理贮尖，實(shí)現(xiàn)了類(lèi)似操作系統(tǒng)中的虛擬內(nèi)存邏輯地址笛粘，對(duì)(pageNumber, offsetInPage)進(jìn)行編碼生成邏輯地址，統(tǒng)一了on heap和off heap內(nèi)存的訪(fǎng)問(wèn)方式湿硝。

3. Tungsten在off heap模式下會(huì)繞過(guò)JVM使用sun.misc.Unsafe的API直接與操作系統(tǒng)交互薪前，進(jìn)行內(nèi)存的申請(qǐng)和釋放，從而免除了創(chuàng)建JVM對(duì)象帶來(lái)的額外內(nèi)存開(kāi)銷(xiāo)以及GC對(duì)性能的影響关斜。

1.1 Memory Manager

上面#1中的事情主要由MemoryManager (StaticMemoryManager或UnifiedMemoryManager)負(fù)責(zé)示括，它會(huì)利用不同的MemoryPool將內(nèi)存按功能和性質(zhì)區(qū)分開(kāi)來(lái)，包括堆內(nèi)存儲(chǔ)內(nèi)存池痢畜，堆外存儲(chǔ)內(nèi)存池垛膝，堆內(nèi)執(zhí)行內(nèi)存池，堆外執(zhí)行內(nèi)存池：

4 memory pools in MemoryManager

memoryPool記錄了內(nèi)存使用狀態(tài)的各項(xiàng)metrics丁稀，比如最大內(nèi)存吼拥，可用內(nèi)存，已用內(nèi)存等二驰。

MemoryManager提供了幾個(gè)方法供調(diào)用者使用以申請(qǐng)和釋放指定類(lèi)型的內(nèi)存空間：

methods for acquiring and releasing memory in MemoryManager

unroll memory是什么扔罪？

這里重點(diǎn)講一下unroll memory的概念，在《Spark SQL內(nèi)核剖析》上看到對(duì)"unroll"的定義：“將partition由不連續(xù)的存儲(chǔ)空間轉(zhuǎn)換為連續(xù)的存儲(chǔ)空間的過(guò)程”桶雀。

為了說(shuō)明這個(gè)問(wèn)題矿酵，我們先來(lái)看看acquireUnrollMemory方法的一個(gè)調(diào)用全過(guò)程：

ShuffleMapTask/ResultTask.runTask -> RDD.iterator -> RDD.getOrCompute -> BlockManager.getOrElseUpdate -> BlockManager.doPutIterator -> MemoryStore.putIteratorAsBytes -> MemoryStore.putIterator -> MemoryStore.reserveUnrollMemoryForThisTask -> MemoryManager.acquireUnrollMemory

可以看到唬复，task（shuffle map task和result task）執(zhí)行時(shí)調(diào)用RDD.iterator獲取指定partition的數(shù)據(jù)迭代器，這個(gè)過(guò)程中的MemoryStore.putIterator會(huì)遍歷指定partition的所有records全肮，獲取每個(gè)value并將其存放在連續(xù)內(nèi)存中：

MemoryStore.putIterator

因?yàn)槭怯玫饕粭l一條record獲取的敞咧，事先并不知道是否有足夠內(nèi)存存放下partition的所有數(shù)據(jù)，所以這里的步驟是這樣的：

1. 先向memoryManager申請(qǐng)一份unroll內(nèi)存（初始大小由參數(shù)spark.storage.unrollMemoryThreshold控制辜腺，默認(rèn)為1mb）休建；

2. 然后每讀一條record都會(huì)評(píng)估一下當(dāng)前所需內(nèi)存是否超過(guò)已分配內(nèi)存，如果超過(guò)评疗，則向memoryManager申請(qǐng)額外需要的內(nèi)存测砂。如果申請(qǐng)成功，則繼續(xù)讀取下一個(gè)record百匆，否則就停止unroll砌些，即存儲(chǔ)partition到內(nèi)存失敗。

loop of reading record in MemoryStore.putIterator

3. 重復(fù)步驟#2加匈，直到partition所有數(shù)據(jù)都成功unroll存璃，或因內(nèi)存不足而停止unroll.

4. 如果partition所有數(shù)據(jù)都成功unroll，則將unroll memory轉(zhuǎn)化成storage memory :

transfer unroll memory to storage memory in MemoryStore.putIterator

可以看到雕拼，最終會(huì)release unroll memory并申請(qǐng)storage memory. 我們看一下UnifiedMemoryManager中acquireUnrollMemory和MemoryManager中releaseUnrollMemory的實(shí)現(xiàn)：

UnifiedMemoryManager.acquireUnrollMemory

MemoryManager.releaseUnrollMemory

可以看到纵东，其實(shí)unroll memory和storage memory的申請(qǐng)及釋放調(diào)用的是同樣的方法。

筆者對(duì)unroll memory的理解是：unroll memory和storage memory本質(zhì)上是同一份內(nèi)存啥寇，只是在任務(wù)執(zhí)行的不同階段的不同邏輯表述形式偎球。在partition數(shù)據(jù)的讀取存儲(chǔ)過(guò)程中，這份內(nèi)存叫做unroll memory示姿，而當(dāng)成功讀取存儲(chǔ)了所有reocrd到內(nèi)存中后甜橱，這份內(nèi)存就改了個(gè)名字叫storage memory了。

注意栈戳，unroll memory的概念只存在于spark的存儲(chǔ)模塊中岂傲，在執(zhí)行模塊中是不存在unroll memory的。

不知不覺(jué)已經(jīng)寫(xiě)了不少字子檀，今天先談到這镊掖，未完待續(xù)。

說(shuō)明

1. 本文內(nèi)容及源碼均基于spark 2.4.0之前版本

2. 水平有限褂痰，有誤之處望讀者指出

最后編輯于：2019.09.18 08:17:51

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末亩进，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子缩歪，更是在濱河造成了極大的恐慌归薛，老刑警劉巖，帶你破解...
沈念sama閱讀 219,539評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異主籍，居然都是意外死亡习贫，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,594評(píng)論 3贊 396
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)千元，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)苫昌，“玉大人，你說(shuō)我怎么就攤上這事幸海∷钌恚” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,871評(píng)論 0贊 356
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵物独，是天一觀的道長(zhǎng)袜硫。經(jīng)常有香客問(wèn)我，道長(zhǎng)议纯，這世上最難降的妖魔是什么父款？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,963評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮瞻凤，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘世杀。我一直安慰自己阀参，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,984評(píng)論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布瞻坝。她就那樣靜靜地躺著蛛壳，像睡著了一般。火紅的嫁衣襯著肌膚如雪所刀。梳的紋絲不亂的頭發(fā)上衙荐，一...
開(kāi)封第一講書(shū)人閱讀 51,763評(píng)論 1贊 307
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音浮创，去河邊找鬼忧吟。笑死，一個(gè)胖子當(dāng)著我的面吹牛斩披，可吹牛的內(nèi)容都是我干的溜族。我是一名探鬼主播，決...
沈念sama閱讀 40,468評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼垦沉，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼煌抒！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起厕倍，我...
開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤寡壮，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體况既，經(jīng)...
沈念sama閱讀 45,850評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡屋群，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,002評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了坏挠。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片芍躏。...
茶點(diǎn)故事閱讀 40,144評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖降狠，靈堂內(nèi)的尸體忽然破棺而出对竣，到底是詐尸還是另有隱情，我是刑警寧澤榜配，帶...
沈念sama閱讀 35,823評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布否纬，位于F島的核電站，受9級(jí)特大地震影響蛋褥，放射性物質(zhì)發(fā)生泄漏临燃。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,483評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一烙心、第九天我趴在偏房一處隱蔽的房頂上張望膜廊。院中可真熱鬧，春花似錦淫茵、人聲如沸爪瓜。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,026評(píng)論 0贊 22
一樁弒父案匙瘪，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)铆铆。三九已至，卻和暖如春丹喻，著一層夾襖步出監(jiān)牢的瞬間薄货，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,150評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工碍论，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留谅猾，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,415評(píng)論 3贊 373
代替公主和親
正文我出身青樓骑冗，卻偏偏與公主長(zhǎng)得像赊瞬，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子贼涩，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,092評(píng)論 2贊 355

Spark內(nèi)存管理功能概述 & 對(duì)Unroll Memory的理解

1 Spark內(nèi)存管理都做了些啥伸刃？

1.1 Memory Manager

unroll memory是什么扔罪？

說(shuō)明

推薦閱讀更多精彩內(nèi)容