spark運(yùn)行流程

spark中基本概念

  1. Application:表示你的應(yīng)用程序
  2. Driver:表示main()函數(shù)无虚,創(chuàng)建SparkContext学赛。由SparkContext負(fù)責(zé)與ClusterManager通信休涤,進(jìn)行資源的申請(qǐng)他炊,任務(wù)的分配和監(jiān)控等搭幻。程序執(zhí)行完畢后關(guān)閉SparkContext
  3. Executor:某個(gè)Application運(yùn)行在Worker節(jié)點(diǎn)上的一個(gè)進(jìn)程循狰,該進(jìn)程負(fù)責(zé)運(yùn)行某些task窟社,并且負(fù)責(zé)將數(shù)據(jù)存在內(nèi)存或者磁盤上。在Spark on Yarn模式下绪钥,其進(jìn)程名稱為 CoarseGrainedExecutor Backend灿里,一個(gè)CoarseGrainedExecutor Backend進(jìn)程有且僅有一個(gè)executor對(duì)象,它負(fù)責(zé)將Task包裝成taskRunner程腹,并從線程池中抽取出一個(gè)空閑線程運(yùn)行Task钠四,這樣,每個(gè)CoarseGrainedExecutorBackend能并行運(yùn)行Task的數(shù)據(jù)就取決于分配給它的CPU的個(gè)數(shù)跪楞。
  4. Worker:集群中可以運(yùn)行Application代碼的節(jié)點(diǎn)缀去。在Standalone模式中指的是通過(guò)slave文件配置的worker節(jié)點(diǎn),在Spark on Yarn模式中指的就是NodeManager節(jié)點(diǎn)甸祭。
  5. Task:在Executor進(jìn)程中執(zhí)行任務(wù)的工作單元缕碎,多個(gè)Task組成一個(gè)Stage
  6. Job:包含多個(gè)Task組成的并行計(jì)算,是由Action行為觸發(fā)的
  7. Stage:每個(gè)Job會(huì)被拆分很多組Task池户,作為一個(gè)TaskSet咏雌,其名稱為Stage
  8. DAGScheduler:根據(jù)Job構(gòu)建基于Stage的DAG,并提交Stage給TaskScheduler校焦,其劃分Stage的依據(jù)是RDD之間的依賴關(guān)系
  9. TaskScheduler:將TaskSet提交給Worker(集群)運(yùn)行赊抖,每個(gè)Executor運(yùn)行什么Task就是在此處分配的。


spark運(yùn)行流程

  1. 構(gòu)建Spark Application的運(yùn)行環(huán)境(啟動(dòng)SparkContext)寨典,SparkContext向資源管理器(可以是Standalone氛雪、Mesos或YARN)注冊(cè)并申請(qǐng)運(yùn)行Executor資源;
  2. 資源管理器分配Executor資源并啟動(dòng)StandaloneExecutorBackend耸成,Executor運(yùn)行情況將隨著心跳發(fā)送到資源管理器上报亩;
  3. SparkContext構(gòu)建成DAG圖,將DAG圖分解成Stage井氢,并把Taskset發(fā)送給Task Scheduler弦追。Executor向SparkContext申請(qǐng)Task
  4. Task Scheduler將Task發(fā)放給Executor運(yùn)行同時(shí)SparkContext將應(yīng)用程序代碼發(fā)放給Executor。
  5. Task在Executor上運(yùn)行花竞,運(yùn)行完畢釋放所有資源劲件。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子零远,更是在濱河造成了極大的恐慌苗分,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,542評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件遍烦,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡躺枕,警方通過(guò)查閱死者的電腦和手機(jī)服猪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,596評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)拐云,“玉大人罢猪,你說(shuō)我怎么就攤上這事〔娲瘢” “怎么了膳帕?”我有些...
    開封第一講書人閱讀 158,021評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)薇缅。 經(jīng)常有香客問(wèn)我危彩,道長(zhǎng),這世上最難降的妖魔是什么泳桦? 我笑而不...
    開封第一講書人閱讀 56,682評(píng)論 1 284
  • 正文 為了忘掉前任汤徽,我火速辦了婚禮,結(jié)果婚禮上灸撰,老公的妹妹穿的比我還像新娘谒府。我一直安慰自己,他們只是感情好浮毯,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,792評(píng)論 6 386
  • 文/花漫 我一把揭開白布完疫。 她就那樣靜靜地躺著,像睡著了一般债蓝。 火紅的嫁衣襯著肌膚如雪壳鹤。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,985評(píng)論 1 291
  • 那天饰迹,我揣著相機(jī)與錄音器虾,去河邊找鬼。 笑死蹦锋,一個(gè)胖子當(dāng)著我的面吹牛兆沙,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播莉掂,決...
    沈念sama閱讀 39,107評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼葛圃,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起库正,我...
    開封第一講書人閱讀 37,845評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤曲楚,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后褥符,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體龙誊,經(jīng)...
    沈念sama閱讀 44,299評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,612評(píng)論 2 327
  • 正文 我和宋清朗相戀三年喷楣,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了趟大。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,747評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡铣焊,死狀恐怖逊朽,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情曲伊,我是刑警寧澤叽讳,帶...
    沈念sama閱讀 34,441評(píng)論 4 333
  • 正文 年R本政府宣布,位于F島的核電站坟募,受9級(jí)特大地震影響岛蚤,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜懈糯,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,072評(píng)論 3 317
  • 文/蒙蒙 一灭美、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧昂利,春花似錦届腐、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,828評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至扩所,卻和暖如春围详,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背祖屏。 一陣腳步聲響...
    開封第一講書人閱讀 32,069評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工助赞, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人袁勺。 一個(gè)月前我還...
    沈念sama閱讀 46,545評(píng)論 2 362
  • 正文 我出身青樓雹食,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親期丰。 傳聞我的和親對(duì)象是個(gè)殘疾皇子群叶,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,658評(píng)論 2 350