DAG


什么是DAG

在Spark里每一個(gè)操作生成一個(gè)RDD,RDD之間連一條邊,最后這些RDD和他們之間的邊組成一個(gè)有向無(wú)環(huán)圖,這個(gè)就是DAG誊册。

Spark 為什么要構(gòu)建DAG?

Spark會(huì)根據(jù)寬依賴窄依賴來(lái)劃分具體的Stage,而依賴有2個(gè)作用:

  • 用來(lái)解決數(shù)據(jù)容錯(cuò)的高效性暖璧;
  • 其二用來(lái)劃分stage案怯。

RDD的依賴關(guān)系分為兩種:窄依賴(Narrow Dependencies)與寬依賴(Wide Dependencies,源碼中稱為Shuffle Dependencies)

  • 窄依賴
    每個(gè)父RDD的一個(gè)Partition最多被子RDD的一個(gè)Partition所使用(1:1 或 n:1)漆撞。例如map殴泰、filter、union等操作都會(huì)產(chǎn)生窄依賴浮驳;
    子RDD分區(qū)通常對(duì)應(yīng)常數(shù)個(gè)父RDD分區(qū)(O(1)悍汛,與數(shù)據(jù)規(guī)模無(wú)關(guān))。
  • 寬依賴
    一個(gè)父RDD的Partition會(huì)被多個(gè)子RDD的Partition所使用至会,例如groupByKey离咐、reduceByKey、sortByKey等操作都會(huì)產(chǎn)生寬依賴;(1:m 或 n:m)
    子RDD分區(qū)通常對(duì)應(yīng)所有的父RDD分區(qū)(O(n)宵蛀,與數(shù)據(jù)規(guī)模有關(guān))

DAG的生成

原始的RDD通過(guò)一系列的轉(zhuǎn)換就形成了DAG昆著,有了計(jì)算的DAG圖,Spark內(nèi)核下一步的任務(wù)就是根據(jù)DAG圖將計(jì)算劃分成任務(wù)集术陶,也就是Stage凑懂,這樣可以將任務(wù)提交到計(jì)算節(jié)點(diǎn)進(jìn)行真正的計(jì)算。Spark計(jì)算的中間結(jié)果默認(rèn)是保存在內(nèi)存中的梧宫,Spark在劃分Stage的時(shí)候會(huì)充分考慮在分布式計(jì)算中可流水線計(jì)算(pipeline)的部分來(lái)提高計(jì)算的效率接谨,而在這個(gè)過(guò)程中Spark根據(jù)RDD之間依賴關(guān)系的不同將DAG劃分成不同的Stage(調(diào)度階段)。對(duì)于窄依賴塘匣,partition的轉(zhuǎn)換處理在一個(gè)Stage中完成計(jì)算脓豪。對(duì)于寬依賴由于有Shuffle的存在忌卤,只能在parent RDD處理完成后扫夜,才能開(kāi)始接下來(lái)的計(jì)算,因此寬依賴是劃分Stage的依據(jù)驰徊。

Spark Works By DAG

Spark 執(zhí)行時(shí)有下面所列的流程:

  • 用戶代碼定義RDD的有向無(wú)環(huán)圖
    RDD上的操作會(huì)創(chuàng)建新的RDD笤闯,并引用它們的父節(jié)點(diǎn),這樣就創(chuàng)建了一個(gè)圖辣垒。

  • 行動(dòng)操作把有向無(wú)環(huán)圖強(qiáng)制轉(zhuǎn)譯為執(zhí)行計(jì)劃
    當(dāng)調(diào)用RDD的一個(gè)行動(dòng)操作時(shí)望侈,這個(gè)RDD就必須被計(jì)算出來(lái)印蔬。這也要求計(jì)算出該RDD的父節(jié)點(diǎn)勋桶。Spark調(diào)度器提交一個(gè)作業(yè)來(lái)計(jì)算出所有必要的RDD。這個(gè)作業(yè)會(huì)包含一個(gè)或多個(gè)步驟侥猬,每個(gè)步驟其實(shí)也就是一波并行執(zhí)行的計(jì)算任務(wù)例驹。一個(gè)步驟對(duì)應(yīng)有向五環(huán)圖中的一個(gè)或多個(gè)RDD,一個(gè)步驟對(duì)應(yīng)多個(gè)RDD是因?yàn)榘l(fā)生了流水線執(zhí)行退唠。

  • 任務(wù)于集群中調(diào)度并執(zhí)行
    步驟是按順序處理的鹃锈,任務(wù)則獨(dú)立的啟動(dòng)來(lái)計(jì)算出RDD的一部分。一旦作業(yè)的最后一個(gè)步驟結(jié)束瞧预,一個(gè)行動(dòng)操作也就執(zhí)行完了屎债。

注:在一個(gè)給定的Spark應(yīng)用中,由于需要?jiǎng)?chuàng)建一系列新的RDD垢油,因此上述階段會(huì)連續(xù)發(fā)生很多次

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末盆驹,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子滩愁,更是在濱河造成了極大的恐慌躯喇,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,744評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件硝枉,死亡現(xiàn)場(chǎng)離奇詭異廉丽,居然都是意外死亡倦微,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,505評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門正压,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)欣福,“玉大人,你說(shuō)我怎么就攤上這事焦履×踊叮” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 163,105評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵裁良,是天一觀的道長(zhǎng)凿将。 經(jīng)常有香客問(wèn)我,道長(zhǎng)价脾,這世上最難降的妖魔是什么牧抵? 我笑而不...
    開(kāi)封第一講書人閱讀 58,242評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮侨把,結(jié)果婚禮上犀变,老公的妹妹穿的比我還像新娘。我一直安慰自己秋柄,他們只是感情好获枝,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,269評(píng)論 6 389
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著骇笔,像睡著了一般省店。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上笨触,一...
    開(kāi)封第一講書人閱讀 51,215評(píng)論 1 299
  • 那天懦傍,我揣著相機(jī)與錄音,去河邊找鬼芦劣。 笑死粗俱,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的虚吟。 我是一名探鬼主播寸认,決...
    沈念sama閱讀 40,096評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼串慰!你這毒婦竟也來(lái)了偏塞?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 38,939評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤模庐,失蹤者是張志新(化名)和其女友劉穎烛愧,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,354評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡怜姿,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,573評(píng)論 2 333
  • 正文 我和宋清朗相戀三年慎冤,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沧卢。...
    茶點(diǎn)故事閱讀 39,745評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡蚁堤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出但狭,到底是詐尸還是另有隱情披诗,我是刑警寧澤,帶...
    沈念sama閱讀 35,448評(píng)論 5 344
  • 正文 年R本政府宣布立磁,位于F島的核電站呈队,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏唱歧。R本人自食惡果不足惜宪摧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,048評(píng)論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望颅崩。 院中可真熱鬧几于,春花似錦、人聲如沸沿后。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,683評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)尖滚。三九已至喉刘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間熔掺,已是汗流浹背饱搏。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,838評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工非剃, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留置逻,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,776評(píng)論 2 369
  • 正文 我出身青樓备绽,卻偏偏與公主長(zhǎng)得像券坞,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子肺素,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,652評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容