Spark RDD的依賴關(guān)系

RDD和它依賴的父RDD(s)的關(guān)系有兩種不同類型烙样,即窄依賴(narrow dependency)和 寬依賴(wide dependency)


Spark的寬依賴和窄依賴

窄依賴:

一:map讼撒、filter執(zhí)行的方法有三個(gè)分區(qū),分別在三個(gè)不同的機(jī)器上试读,對(duì)其進(jìn)行map、filter操作钩骇,生成的新的數(shù)據(jù)還在原來的機(jī)器上,子依賴和父依賴的數(shù)據(jù)的分區(qū)一一對(duì)應(yīng)

二:union(并集):執(zhí)行操作前有兩個(gè)RDD倘屹,假如第一個(gè)RDD的數(shù)據(jù)分區(qū)對(duì)應(yīng)的機(jī)器是node-1和nod-2,第二個(gè)分區(qū)對(duì)應(yīng)的機(jī)器是node-3和node-4纽匙,合并之后成為一個(gè)RDD,該RDD有四個(gè)分區(qū)烛缔,他的數(shù)據(jù)位置也沒有發(fā)送變化馏段,分區(qū)的數(shù)據(jù)和執(zhí)行操作前數(shù)據(jù)一一對(duì)應(yīng)

三:join with inputs co-partitioned:執(zhí)行操作前有兩個(gè)RDD轩拨,執(zhí)行操作后生成一個(gè)新的RDD,該方法進(jìn)行了網(wǎng)絡(luò)傳輸院喜,假如執(zhí)行操作前的數(shù)據(jù)對(duì)應(yīng)的機(jī)器為node-1~6亡蓉,執(zhí)行操作后的分區(qū)為node-1~3,只不過是子RDD一個(gè)分區(qū)的數(shù)據(jù)來自與兩個(gè)分區(qū)的數(shù)據(jù)


舉例:


join執(zhí)行過程


join執(zhí)行結(jié)果


第一次RunjobDAG圖


第二次RunjobDAG圖

? ? ? ? ? ?注:這時(shí)候喷舀,我們的join操作就是窄依賴

窄依賴是指每個(gè)父RDD的一個(gè)分區(qū)的數(shù)據(jù)最多被子RDD的一個(gè)分區(qū)所使用砍濒,例如map、filter硫麻、union等操作都會(huì)產(chǎn)生窄依賴爸邢;


????????需要特別說明的是對(duì)join操作有兩種情況:如果兩個(gè)RDD在進(jìn)行join操作時(shí),一個(gè)RDD的partition僅僅和另一個(gè)RDD中已知個(gè)數(shù)的Partition進(jìn)行join拿愧,那么這種類型的join操作就是窄依賴杠河,例如圖1中左半部分的join操作(join with inputs co-partitioned);其它情況的join操作就是寬依賴,例如圖1中右半部分的join操作(join with inputs not co-partitioned)赶掖,由于是需要父RDD的所有partition進(jìn)行join的轉(zhuǎn)換感猛,這就涉及到了shuffle,因此這種類型的join操作也是寬依賴奢赂。


寬依賴:

寬依賴是指一個(gè)父RDD的分區(qū)數(shù)據(jù)會(huì)被多個(gè)子RDD的Partition所使用陪白,例如groupByKey、reduceByKey膳灶、sortByKey等操作都會(huì)產(chǎn)生寬依賴咱士;


? ?舉例:


join執(zhí)行過程


join執(zhí)行結(jié)果


DAG圖

?總結(jié):在這里我們是從父RDD的partition被使用的個(gè)數(shù)來定義窄依賴和寬依賴,因此可以用一句話概括下:如果父RDD的一個(gè)Partition被子RDD的一個(gè)Partition所使用就是窄依賴轧钓,否則的話就是寬依賴序厉。因?yàn)槭谴_定的partition數(shù)量的依賴關(guān)系,所以RDD之間的依賴關(guān)系就是窄依賴毕箍;由此我們可以得出一個(gè)推論:即窄依賴不僅包含一對(duì)一的窄依賴弛房,還包含一對(duì)固定個(gè)數(shù)的窄依賴。


? ? ? ? ? ? ? ?一對(duì)固定個(gè)數(shù)的窄依賴的理解:即子RDD的partition對(duì)父RDD依賴的Partition的數(shù)量不會(huì)隨著RDD數(shù)據(jù)規(guī)模的改變而改變而柑;換句話說文捶,無論是有100T的數(shù)據(jù)量還是1P的數(shù)據(jù)量,在窄依賴中媒咳,子RDD所依賴的父RDD的partition的個(gè)數(shù)是確定的粹排,而寬依賴是shuffle級(jí)別的,數(shù)據(jù)量越大涩澡,那么子RDD所依賴的父RDD的個(gè)數(shù)就越多顽耳,從而子RDD所依賴的父RDD的partition的個(gè)數(shù)也會(huì)變得越來越多。

Shuffle的定義:

? ? ? ? ? ? ? Shuffle的含義是洗牌,將數(shù)據(jù)打散射富,父RDD的一個(gè)分區(qū)的數(shù)據(jù)如果給了子RDD的多個(gè)分區(qū)(只有存在這種可能)膝迎,就是Shuffle

? ? ? ? ? ? ?Shuffle會(huì)有網(wǎng)絡(luò)傳輸數(shù)據(jù),但有網(wǎng)絡(luò)傳輸胰耗,并不意味著就是Shuffle

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子拖陆,更是在濱河造成了極大的恐慌,老刑警劉巖乎串,帶你破解...
    沈念sama閱讀 222,252評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件叹誉,死亡現(xiàn)場(chǎng)離奇詭異闷旧,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)匠襟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門该园,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人啃勉,你說我怎么就攤上這事双妨。” “怎么了枝嘶?”我有些...
    開封第一講書人閱讀 168,814評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵群扶,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我缴饭,道長(zhǎng),這世上最難降的妖魔是什么颗搂? 我笑而不...
    開封第一講書人閱讀 59,869評(píng)論 1 299
  • 正文 為了忘掉前任丢氢,我火速辦了婚禮先改,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘貌嫡。我一直安慰自己,他們只是感情好岛抄,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評(píng)論 6 398
  • 文/花漫 我一把揭開白布夫椭。 她就那樣靜靜地躺著论皆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪点晴。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,475評(píng)論 1 312
  • 那天陪竿,我揣著相機(jī)與錄音族跛,去河邊找鬼锐墙。 笑死,一個(gè)胖子當(dāng)著我的面吹牛溪北,可吹牛的內(nèi)容都是我干的夺脾。 我是一名探鬼主播咧叭,決...
    沈念sama閱讀 41,010評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼菲茬,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼派撕!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起马胧,我...
    開封第一講書人閱讀 39,924評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蛙粘,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體穴肘,經(jīng)...
    沈念sama閱讀 46,469評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡舔痕,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評(píng)論 3 342
  • 正文 我和宋清朗相戀三年伯复,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啸如。...
    茶點(diǎn)故事閱讀 40,680評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡叮雳,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出说莫,到底是詐尸還是另有隱情,我是刑警寧澤储狭,帶...
    沈念sama閱讀 36,362評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站晶密,受9級(jí)特大地震影響稻艰,放射性物質(zhì)發(fā)生泄漏懂牧。R本人自食惡果不足惜僧凤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評(píng)論 3 335
  • 文/蒙蒙 一躯保、第九天 我趴在偏房一處隱蔽的房頂上張望澎语。 院中可真熱鬧,春花似錦擅羞、人聲如沸减俏。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽历筝。三九已至,卻和暖如春仔雷,著一層夾襖步出監(jiān)牢的瞬間舔示,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評(píng)論 1 274
  • 我被黑心中介騙來泰國打工竖共, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留俺祠,地道東北人借帘。 一個(gè)月前我還...
    沈念sama閱讀 49,099評(píng)論 3 378
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像腿准,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子吐葱,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評(píng)論 2 361