【Spark系列】spark中job恳邀,stage懦冰,task之間的關(guān)系

1.?什么是job

Job簡(jiǎn)單講就是提交給spark的任務(wù)。

2.?什么是stage

Stage是每一個(gè)job處理過程要分為的幾個(gè)階段谣沸。

3.什么是task

Task是每一個(gè)job處理過程要分幾為幾次任務(wù)刷钢。Task是任務(wù)運(yùn)行的最小單位。最終是要以task為單位運(yùn)行在executor中乳附。

4.?Job和stage和task之間有什么關(guān)系

Job <---> 一個(gè)或多個(gè)stage <---> 一個(gè)或多個(gè)task

下圖是一個(gè)job分成了三個(gè)stage:

5.一個(gè)stage的task的數(shù)量是有誰來決定的内地?

是由輸入文件的切片個(gè)數(shù)來決定的。在HDFS中不大于128m的文件算一個(gè)切片(默認(rèn)128m)赋除。通過算子修改了某一個(gè)rdd的分區(qū)數(shù)量阱缓,task數(shù)量也會(huì)同步修改。

6.一個(gè)job任務(wù)的task數(shù)量是由誰來決定的举农?

一個(gè)job任務(wù)可以有一個(gè)或多個(gè)stage荆针,一個(gè)stage又可以有一個(gè)或多個(gè)task。所以一個(gè)job的task數(shù)量是 ?(多個(gè)stage的task數(shù)量)的總和。



上圖就是job1有2個(gè)stage航背,共3個(gè)task喉悴。

7.每一個(gè)stage中的task最大的并行度?

并行度:是指指令并行執(zhí)行的最大條數(shù)玖媚。在指令流水中箕肃,同時(shí)執(zhí)行多條指令稱為指令并行。

理論上:每一個(gè)stage下有多少的分區(qū)今魔,就有多少的task突雪,task的數(shù)量就是我們?nèi)蝿?wù)的最大的并行度。

(一般情況下涡贱,我們一個(gè)task運(yùn)行的時(shí)候咏删,使用一個(gè)cores)

實(shí)際上:最大的并行度,取決于我們的application任務(wù)運(yùn)行時(shí)使用的executor擁有的cores的數(shù)量问词。

如圖所示督函,cores為4,那么最大的并行度就是4激挪。

8.如果我們的task數(shù)量超過這個(gè)cores的總數(shù)怎么辦辰狡?

--num-executors 2 --executor-memory 512m --executor-cores 2

當(dāng)前stage有200個(gè)task,先執(zhí)行cores個(gè)數(shù)量的task垄分,然后等待cpu資源空閑后宛篇,繼續(xù)執(zhí)行剩下的task。

9.spark執(zhí)行時(shí)讀條中的內(nèi)容講解

Stage60:當(dāng)前的stage編號(hào)

(105+2)/200:200:當(dāng)前stage的task的數(shù)量薄湿;105:已完成的task數(shù)量叫倍;4:等待執(zhí)行的task數(shù)量。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末豺瘤,一起剝皮案震驚了整個(gè)濱河市吆倦,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌坐求,老刑警劉巖蚕泽,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異桥嗤,居然都是意外死亡须妻,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門泛领,熙熙樓的掌柜王于貴愁眉苦臉地迎上來荒吏,“玉大人,你說我怎么就攤上這事师逸∷疽校” “怎么了豆混?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)动知。 經(jīng)常有香客問我皿伺,道長(zhǎng),這世上最難降的妖魔是什么盒粮? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任鸵鸥,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己巡扇,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布讼油。 她就那樣靜靜地躺著,像睡著了一般呢簸。 火紅的嫁衣襯著肌膚如雪矮台。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天根时,我揣著相機(jī)與錄音瘦赫,去河邊找鬼。 笑死蛤迎,一個(gè)胖子當(dāng)著我的面吹牛确虱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播替裆,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼校辩,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了扎唾?” 一聲冷哼從身側(cè)響起召川,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎胸遇,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體汉形,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡纸镊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了概疆。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逗威。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖岔冀,靈堂內(nèi)的尸體忽然破棺而出凯旭,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布罐呼,位于F島的核電站鞠柄,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏嫉柴。R本人自食惡果不足惜厌杜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望计螺。 院中可真熱鬧夯尽,春花似錦、人聲如沸登馒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽陈轿。三九已至肺孤,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間济欢,已是汗流浹背赠堵。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留法褥,地道東北人茫叭。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像半等,于是被迫代替她去往敵國(guó)和親揍愁。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • spark-submit的時(shí)候如何引入外部jar包 在通過spark-submit提交任務(wù)時(shí)杀饵,可以通過添加配置參數(shù)...
    博弈史密斯閱讀 2,740評(píng)論 1 14
  • Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎莽囤。Spark是UC Berkeley AM...
    大佛愛讀書閱讀 2,827評(píng)論 0 20
  • 通過文章“Spark核心概念RDD”我們知道,Spark的核心是根據(jù)RDD來實(shí)現(xiàn)的切距,Spark Scheduler...
    尼小摩閱讀 676評(píng)論 1 9
  • Spark Job執(zhí)行流程大體如下:用戶提交Job后會(huì)生成SparkContext對(duì)象朽缎,SparkContext向...
    imarch1閱讀 3,649評(píng)論 0 7
  • 為什么需要調(diào)優(yōu) 在大數(shù)據(jù)計(jì)算領(lǐng)域,Spark已經(jīng)成為了越來越流行谜悟、越來越受歡迎的計(jì)算平臺(tái)之一话肖。然而,通過Spark...
    卡卡xx閱讀 1,584評(píng)論 1 3