Spark架構(gòu)原理

Spark的計算階段

我們可以對比來看竹椒。首先和MapReduce一個應(yīng)用一次只運(yùn)行一個map和一個reduce不同苹熏，Spark可以根據(jù)應(yīng)用的復(fù)雜程度，分割成更多的計算階段（stage），這些計算階段組成一個有向無環(huán)圖DAG共苛，Spark任務(wù)調(diào)度器可以根據(jù)DAG的依賴關(guān)系執(zhí)行計算階段。

image

從圖上看蜓萄，整個應(yīng)用被切分成3個階段隅茎，階段3需要依賴階段1和階段2，階段1和階段2互不依賴嫉沽。Spark在執(zhí)行調(diào)度的時候辟犀，先執(zhí)行階段1和階段2，完成以后绸硕，再執(zhí)行階段3堂竟。如果有更多的階段魂毁，Spark的策略也是一樣的。只要根據(jù)程序初始化好DAG跃捣，就建立了依賴關(guān)系漱牵，然后根據(jù)依賴關(guān)系順序執(zhí)行各個計算階段，Spark大數(shù)據(jù)應(yīng)用的計算就完成了疚漆。

上圖這個DAG對應(yīng)的Spark程序偽代碼如下酣胀。

rddB = rddA.groupBy(key)
rddD = rddC.map(func)
rddF = rddD.union(rddE)
rddG = rddB.join(rddF)

一個數(shù)據(jù)集中的多個數(shù)據(jù)分片需要進(jìn)行分區(qū)傳輸，寫入到另一個數(shù)據(jù)集的不同分片中娶聘，這種數(shù)據(jù)分區(qū)交叉?zhèn)鬏數(shù)牟僮魑畔猓覀冊贛apReduce的運(yùn)行過程中也看到過。

image

Spark也需要通過shuffle將數(shù)據(jù)進(jìn)行重新組合丸升，相同Key的數(shù)據(jù)放在一起铆农，進(jìn)行聚合、關(guān)聯(lián)等操作狡耻，因而每次shuffle都產(chǎn)生新的計算階段墩剖。這也是為什么計算階段會有依賴關(guān)系，它需要的數(shù)據(jù)來源于前面一個或多個計算階段產(chǎn)生的數(shù)據(jù)夷狰，必須等待前面的階段執(zhí)行完畢才能進(jìn)行shuffle岭皂，并得到數(shù)據(jù)。

計算階段劃分的依據(jù)是shuffle沼头，不是轉(zhuǎn)換函數(shù)的類型爷绘，有的函數(shù)有時候有shuffle，有時候沒有进倍。比如上圖例子中RDD B和RDD F進(jìn)行join土至，得到RDD G，這里的RDD F需要進(jìn)行shuffle猾昆，RDD B就不需要陶因。

image

因?yàn)镽DD B在前面一個階段，階段1的shuffle過程中垂蜗，已經(jīng)進(jìn)行了數(shù)據(jù)分區(qū)楷扬。分區(qū)數(shù)目和分區(qū)Key不變，就不需要再進(jìn)行shuffle么抗。

image

這種不需要進(jìn)行shuffle的依賴毅否，在Spark里被稱作窄依賴；相反的蝇刀，需要進(jìn)行shuffle的依賴螟加，被稱作寬依賴。跟MapReduce一樣，shuffle也是Spark最重要的一個環(huán)節(jié)捆探，只有通過shuffle然爆，相關(guān)數(shù)據(jù)才能互相計算，構(gòu)建起復(fù)雜的應(yīng)用邏輯黍图。

Spark的作業(yè)管理

RDD里面的每個數(shù)據(jù)分片曾雕，Spark都會創(chuàng)建一個計算任務(wù)去處理，所以一個計算階段會包含很多個計算任務(wù)（task）助被。

關(guān)于作業(yè)剖张、計算階段、任務(wù)的依賴和時間先后關(guān)系你可以通過下圖看到揩环。

image

圖中橫軸方向是時間搔弄，縱軸方向是任務(wù)。兩條粗黑線之間是一個作業(yè)丰滑，兩條細(xì)線之間是一個計算階段顾犹。一個作業(yè)至少包含一個計算階段。水平方向紅色的線是任務(wù)褒墨，每個階段由很多個任務(wù)組成炫刷，這些任務(wù)組成一個任務(wù)集合。

DAGScheduler根據(jù)代碼生成DAG圖以后郁妈，Spark的任務(wù)調(diào)度就以任務(wù)為單位進(jìn)行分配浑玛，將任務(wù)分配到分布式集群的不同機(jī)器上執(zhí)行。

Spark的執(zhí)行過程

Spark支持Standalone圃庭、Yarn锄奢、Mesos失晴、Kubernetes等多種部署方案剧腻，幾種部署方案原理也都一樣，只是不同組件角色命名不同涂屁，但是核心功能和運(yùn)行流程都差不多书在。

image

首先，Spark應(yīng)用程序啟動在自己的JVM進(jìn)程里拆又，即Driver進(jìn)程儒旬，啟動后調(diào)用SparkContext初始化執(zhí)行配置和輸入數(shù)據(jù)。SparkContext啟動DAGScheduler構(gòu)造執(zhí)行的DAG圖帖族，切分成最小的執(zhí)行單位也就是計算任務(wù)栈源。

然后Driver向Cluster Manager請求計算資源，用于DAG的分布式計算竖般。Cluster Manager收到請求以后甚垦，將Driver的主機(jī)地址等信息通知給集群的所有計算節(jié)點(diǎn)Worker。

Worker收到信息以后，根據(jù)Driver的主機(jī)地址艰亮，跟Driver通信并注冊闭翩，然后根據(jù)自己的空閑資源向Driver通報自己可以領(lǐng)用的任務(wù)數(shù)。Driver根據(jù)DAG圖開始向注冊的Worker分配任務(wù)迄埃。

Worker收到任務(wù)后疗韵，啟動Executor進(jìn)程開始執(zhí)行任務(wù)。Executor先檢查自己是否有Driver的執(zhí)行代碼侄非，如果沒有蕉汪，從Driver下載執(zhí)行代碼，通過Java反射加載后開始執(zhí)行逞怨。

Spark有三個主要特性：RDD的編程模型更簡單肤无，DAG切分的多階段計算過程更快速，使用內(nèi)存存儲中間計算結(jié)果更高效骇钦。這三個特性使得Spark相對Hadoop MapReduce可以有更快的執(zhí)行速度宛渐，以及更簡單的編程實(shí)現(xiàn)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末眯搭，一起剝皮案震驚了整個濱河市窥翩，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌鳞仙，老刑警劉巖寇蚊，帶你破解...
沈念sama閱讀 216,372評論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異棍好，居然都是意外死亡仗岸，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門借笙，熙熙樓的掌柜王于貴愁眉苦臉地迎上來扒怖，“玉大人，你說我怎么就攤上這事业稼〉裂鳎” “怎么了？”我有些...
開封第一講書人閱讀 162,415評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵低散，是天一觀的道長俯邓。經(jīng)常有香客問我，道長熔号，這世上最難降的妖魔是什么稽鞭？我笑而不...
開封第一講書人閱讀 58,157評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮引镊，結(jié)果婚禮上朦蕴，老公的妹妹穿的比我還像新娘吃嘿。我一直安慰自己，他們只是感情好梦重，可當(dāng)我...
茶點(diǎn)故事閱讀 67,171評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布兑燥。她就那樣靜靜地躺著，像睡著了一般琴拧。火紅的嫁衣襯著肌膚如雪降瞳。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,125評論 1贊 297
城市分裂傳說
那天蚓胸，我揣著相機(jī)與錄音挣饥，去河邊找鬼。笑死沛膳，一個胖子當(dāng)著我的面吹牛扔枫，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播锹安，決...
沈念sama閱讀 40,028評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼短荐，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了叹哭？” 一聲冷哼從身側(cè)響起忍宋，我...
開封第一講書人閱讀 38,887評論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎风罩，沒想到半個月后糠排，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,310評論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡超升，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,533評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年入宦，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片室琢。...
茶點(diǎn)故事閱讀 39,690評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡乾闰，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出研乒，到底是詐尸還是另有隱情汹忠，我是刑警寧澤淋硝，帶...
沈念sama閱讀 35,411評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布雹熬，位于F島的核電站，受9級特大地震影響谣膳，放射性物質(zhì)發(fā)生泄漏竿报。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,004評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一继谚、第九天我趴在偏房一處隱蔽的房頂上張望烈菌。院中可真熱鬧，春花似錦、人聲如沸芽世。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽济瓢。三九已至荠割，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間旺矾，已是汗流浹背蔑鹦。一陣腳步聲響...
開封第一講書人閱讀 32,812評論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留箕宙，地道東北人嚎朽。一個月前我還...
沈念sama閱讀 47,693評論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長得像柬帕，于是被迫代替她去往敵國和親哟忍。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,577評論 2贊 353

Spark架構(gòu)原理

Spark的計算階段

Spark的作業(yè)管理

Spark的執(zhí)行過程

推薦閱讀更多精彩內(nèi)容