集群模式概述(Cluster Mode Overview)-- Spark 1.6

來源: http://spark.apache.org/docs/1.6.0/cluster-overview.html
下面是對上述來源中Spark官方文檔的中文翻譯

本文簡要概述Spark如何在集群上運(yùn)行遭居,以便更容易地了解所涉及的組件拼卵。閱讀應(yīng)用程序提交指南(application submission guide ),了解在群集上啟動(dòng)應(yīng)用程序惠啄。

組件

Spark應(yīng)用程序作為一組進(jìn)程獨(dú)立的在集群上運(yùn)行,由主程序中的SparkContext對象(稱為驅(qū)動(dòng)程序)協(xié)調(diào)合敦。

具體來說牲迫,要在集群上運(yùn)行,SparkContext可以連接到幾種類型的集群管理器(Spark自己的獨(dú)立集群管理器衡楞,Mesos或YARN)吱雏,它們可以跨應(yīng)用程序分配資源。 連接后瘾境,Spark會(huì)在集群中的節(jié)點(diǎn)上獲取執(zhí)行程序歧杏,這些進(jìn)程是為應(yīng)用程序運(yùn)行計(jì)算和存儲(chǔ)數(shù)據(jù)的進(jìn)程。 接下來迷守,它將應(yīng)用程序代碼(由JAR或Python文件定義傳遞給SparkContext)發(fā)送給執(zhí)行者犬绒。 最后,SparkContext將任務(wù)發(fā)送給執(zhí)行器來運(yùn)行兑凿。

這個(gè)架構(gòu)有幾個(gè)有用的事情需要注意:

  1. 每個(gè)應(yīng)用程序都有自己的執(zhí)行進(jìn)程凯力,它們在整個(gè)應(yīng)用程序的運(yùn)行時(shí)間內(nèi)一直存在,并且持續(xù)運(yùn)行礼华,還在多個(gè)線程中運(yùn)行任務(wù)咐鹤。這有利于在調(diào)度端(每個(gè)驅(qū)動(dòng)程序調(diào)度其自己的任務(wù))和執(zhí)行器端(來自不同應(yīng)用程序的任務(wù)在不同的JVM中運(yùn)行)將應(yīng)用程序彼此隔離。但是圣絮,這也意味著數(shù)據(jù)不能在不將其寫入外部存儲(chǔ)系統(tǒng)的情況下跨不同的Spark應(yīng)用程序(SparkContext實(shí)例)共享祈惶。

  2. Spark對底層集群管理器是不可知的。只要它可以獲得執(zhí)行器進(jìn)程,并且這些進(jìn)程彼此通信捧请,它也能夠相對容易的在其他集群管理器上運(yùn)行凡涩,即使這個(gè)集群管理器支持其他應(yīng)用程序(例如Mesos / YARN)。

  3. 驅(qū)動(dòng)程序必須在其生命周期內(nèi)偵聽并接受來自其執(zhí)行器的傳入連接(例如疹蛉,請參閱 spark.driver.port and spark.fileserver.port in the network config section)活箕。因此,驅(qū)動(dòng)程序必須是工作節(jié)點(diǎn)的網(wǎng)絡(luò)可可找到的氧吐。

  4. 因?yàn)轵?qū)動(dòng)程序在群集上調(diào)度任務(wù)讹蘑,所以它應(yīng)該靠近工作節(jié)點(diǎn)運(yùn)行,最好在同一個(gè)局域網(wǎng)上運(yùn)行筑舅。如果你想遠(yuǎn)程發(fā)送請求到集群座慰,最好打開一個(gè)RPC給驅(qū)動(dòng)程序,并讓它從附近提交操作翠拣,這比遠(yuǎn)離工作節(jié)點(diǎn)要好版仔。

集群管理器類型

系統(tǒng)目前支持三個(gè)集群管理器:

  • Standalone - 包含在Spark中的簡單集群管理器,可以輕松設(shè)置集群误墓。
  • Apache Mesos - 一個(gè)通用集群管理器蛮粮,也可以運(yùn)行Hadoop MapReduce和服務(wù)應(yīng)用程序。
  • Hadoop YARN - Hadoop 2中的資源管理器谜慌。
下表總結(jié)了您將看到的用于引用群集概念的術(shù)語:

|術(shù)語 |含義
|------------------
|Application | 用戶基于Spark構(gòu)建的程序然想。由集群上的* driver program executors組成。
|Application jar|包含用戶的Spark應(yīng)用程序的jar欣范。在某些情況下变泄,用戶需要?jiǎng)?chuàng)建一個(gè)包含其應(yīng)用程序及其依賴關(guān)系的“uber jar”。用戶的jar不應(yīng)包括Hadoop或Spark庫恼琼,但是妨蛹,這些將在運(yùn)行時(shí)添加。
|Driver program|運(yùn)行應(yīng)用程序的main()函數(shù)并創(chuàng)建SparkContext的進(jìn)程
|Cluster manager|用于獲取集群上資源的外部服務(wù)(例如獨(dú)立管理器晴竞,Mesos蛙卤,YARN)
|Deploy mode|區(qū)分驅(qū)動(dòng)程序進(jìn)程運(yùn)行的位置。在“集群”模式下噩死,框架會(huì)啟動(dòng)集群中的驅(qū)動(dòng)程序颤难。在“客戶端”模式下,提交器在集群外啟動(dòng)驅(qū)動(dòng)程序甜滨。
|Worker node|任何可以在集群中運(yùn)行應(yīng)用程序代碼的節(jié)點(diǎn)
|Executor|為工作節(jié)點(diǎn)上的應(yīng)用程序啟動(dòng)的進(jìn)程乐严,它運(yùn)行任務(wù)并在內(nèi)存或磁盤存儲(chǔ)中保存數(shù)據(jù)。每個(gè)應(yīng)用程序都有自己的executors衣摩。
|Task|將發(fā)送給一個(gè)executor的工作單元
|Job|由多個(gè)任務(wù)組成的并行計(jì)算,它們響應(yīng)Spark動(dòng)作(例如:save,collect)而生成;可以在驅(qū)動(dòng)程序日志中看到此術(shù)語艾扮。
|Stage|每個(gè)作業(yè)被分成更小的任務(wù)集既琴,稱為彼此依賴的
stages *(類似于MapReduce中的map和reduce階段);可以在驅(qū)動(dòng)程序日志中看到此術(shù)語。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末泡嘴,一起剝皮案震驚了整個(gè)濱河市甫恩,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌酌予,老刑警劉巖磺箕,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異抛虫,居然都是意外死亡松靡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進(jìn)店門建椰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來雕欺,“玉大人,你說我怎么就攤上這事棉姐⊥懒校” “怎么了?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵伞矩,是天一觀的道長笛洛。 經(jīng)常有香客問我,道長乃坤,這世上最難降的妖魔是什么苛让? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮侥袜,結(jié)果婚禮上蝌诡,老公的妹妹穿的比我還像新娘。我一直安慰自己枫吧,他們只是感情好浦旱,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著九杂,像睡著了一般颁湖。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上例隆,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天甥捺,我揣著相機(jī)與錄音,去河邊找鬼镀层。 笑死镰禾,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播吴侦,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼屋休,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了备韧?” 一聲冷哼從身側(cè)響起劫樟,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎织堂,沒想到半個(gè)月后叠艳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡易阳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年附较,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了瓷式。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片春霍。...
    茶點(diǎn)故事閱讀 40,680評論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖足删,靈堂內(nèi)的尸體忽然破棺而出黑竞,到底是詐尸還是另有隱情捕发,我是刑警寧澤,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布很魂,位于F島的核電站扎酷,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏遏匆。R本人自食惡果不足惜法挨,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望幅聘。 院中可真熱鬧凡纳,春花似錦、人聲如沸帝蒿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽葛超。三九已至暴氏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間绣张,已是汗流浹背答渔。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留侥涵,地道東北人沼撕。 一個(gè)月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓宋雏,卻偏偏與公主長得像,于是被迫代替她去往敵國和親端朵。 傳聞我的和親對象是個(gè)殘疾皇子好芭,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容