Spark Applications, Jobs, Stages, and Tasks

Applications

一個(gè)spark Application由一個(gè)或多個(gè)job組成窃诉。

Jobs

一個(gè)job是由一個(gè)或多個(gè)stage組成的。對(duì)RDD每次執(zhí)行一個(gè)action操作被饿,都會(huì)觸發(fā)提交一個(gè)job。

Stages

一個(gè)stage由一個(gè)或多個(gè)task組成禽捆。RDD經(jīng)過一系列的轉(zhuǎn)換會(huì)生成一個(gè)DAG藐石,spark會(huì)根據(jù)寬依賴(wide dependency)將DAG劃分為不同的stage。

Tasks

一個(gè)task負(fù)責(zé)處理RDD一個(gè)partition的數(shù)據(jù)吨悍。一個(gè)stage內(nèi)部會(huì)啟動(dòng)多個(gè)task扫茅。
樣例分析


在spark上運(yùn)行如下代碼

object SimpleApp {
  def main(args: Array[String]) {

    val conf = new SparkConf().setAppName("Simple Application")
    val sc = new SparkContext(conf)

    val rddA = sc.textFile("/tmp/xyx/textA")
    val rddB = sc.textFile("/tmp/xyx/textB")

    val rddAA = rddA.flatMap(line => line.split(",")).map(word => (word, 1))
    val rddBB = rddB.flatMap(line => line.split(",")).map(word => (word, 1))

    val rddAAA = rddAA.groupByKey(1)
    val rddBBB = rddBB.groupByKey(1)

    val rddC = rddAAA.join(rddBBB)

    rddC.count

    rddC.collect

    sc.stop()
  }
}

代碼中運(yùn)行了兩個(gè)RDD的action(countcollect),所以這個(gè)spark的Application會(huì)啟動(dòng)2個(gè)job育瓜,如下圖


可以看到每個(gè)job都是由3個(gè)stage組成的葫隙,只不過它們的前兩個(gè)stage完全一樣,所以Job 1的狀態(tài)是skipped躏仇。
那么為什么是3個(gè)stage恋脚,是怎么劃分的?
這就要看一下上面代碼中RDD的轉(zhuǎn)換有哪些是寬依賴焰手,即groupByKeyjoin糟描。那么從rddA轉(zhuǎn)換為rddAA是一個(gè)stage,rddB轉(zhuǎn)換為rddBB是一個(gè)stage书妻,最后上面兩個(gè)stage的結(jié)果rddAAA和rddBBB到rddC為一個(gè)stage船响,一共3個(gè)stage。

進(jìn)入到Job 0中,如下圖见间,看一下具體的3個(gè)stage聊闯,每個(gè)stage里面啟動(dòng)了多個(gè)task。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末缤剧,一起剝皮案震驚了整個(gè)濱河市馅袁,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌荒辕,老刑警劉巖汗销,帶你破解...
    沈念sama閱讀 211,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異抵窒,居然都是意外死亡弛针,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門李皇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來削茁,“玉大人,你說我怎么就攤上這事掉房〖氚希” “怎么了?”我有些...
    開封第一講書人閱讀 157,435評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵卓囚,是天一觀的道長(zhǎng)瘾杭。 經(jīng)常有香客問我,道長(zhǎng)哪亿,這世上最難降的妖魔是什么粥烁? 我笑而不...
    開封第一講書人閱讀 56,509評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮蝇棉,結(jié)果婚禮上讨阻,老公的妹妹穿的比我還像新娘。我一直安慰自己篡殷,他們只是感情好钝吮,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,611評(píng)論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著板辽,像睡著了一般奇瘦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上戳气,一...
    開封第一講書人閱讀 49,837評(píng)論 1 290
  • 那天链患,我揣著相機(jī)與錄音巧鸭,去河邊找鬼瓶您。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的呀袱。 我是一名探鬼主播贸毕,決...
    沈念sama閱讀 38,987評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼夜赵!你這毒婦竟也來了明棍?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,730評(píng)論 0 267
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤寇僧,失蹤者是張志新(化名)和其女友劉穎摊腋,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體嘁傀,經(jīng)...
    沈念sama閱讀 44,194評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡兴蒸,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,525評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了细办。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片橙凳。...
    茶點(diǎn)故事閱讀 38,664評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖笑撞,靈堂內(nèi)的尸體忽然破棺而出岛啸,到底是詐尸還是另有隱情,我是刑警寧澤茴肥,帶...
    沈念sama閱讀 34,334評(píng)論 4 330
  • 正文 年R本政府宣布坚踩,位于F島的核電站,受9級(jí)特大地震影響炉爆,放射性物質(zhì)發(fā)生泄漏堕虹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,944評(píng)論 3 313
  • 文/蒙蒙 一芬首、第九天 我趴在偏房一處隱蔽的房頂上張望赴捞。 院中可真熱鬧,春花似錦郁稍、人聲如沸赦政。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)恢着。三九已至,卻和暖如春财破,著一層夾襖步出監(jiān)牢的瞬間掰派,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工左痢, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留靡羡,地道東北人系洛。 一個(gè)月前我還...
    沈念sama閱讀 46,389評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像略步,于是被迫代替她去往敵國(guó)和親描扯。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,554評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容