spark概念理解

1. Application:Spark 的應用程序空盼,用戶提交后,Spark為App分配資源,將程序轉換并執(zhí)行晦溪,其中Application包含一個Driver program和若干Executor

2. SparkContext:Spark 應用程序的入口,負責創(chuàng)建dagSchduler挣跋,TaskScheduler三圆,SchedulerBackend,在實例化的過程中register當前程序給Master避咆;在運行過程中負責調度各個運算資源舟肉,協(xié)調各個 WorkerNode 上的Executor。

3. Driver Program:運行Application的main()函數(shù)并且創(chuàng)建SparkContext

4. Executor:是為Application運行在Worker node上的一個進程查库,通過線程池并發(fā)執(zhí)行和線程復用的方式路媚,負責具體task的執(zhí)行;并且負責將數(shù)據(jù)存在內存或者磁盤上膨报。每個Application都會申請各自的Executor來處理任務

5. Master:接收用戶提交的程序并發(fā)送指令給Worker為當前程序分配計算資源

6. Worker的解釋

a. 接受Master的指令磷籍,啟動或者殺掉Executor (通過一個Proxy為Executor Runner的對象實例來遠程啟動ExecutorBackend進行,ExecutorBacnend進程里面有Executor现柠,實際在工作的時候院领,會通過TaskRunner來封裝Task,然后從ThreadPool中獲取一條線程執(zhí)行Task够吩,執(zhí)行完成后線程被回收復用)

b. 接受Master的指令比然,啟動或者殺掉Driver

c. 報告Executor/Driver的狀態(tài)到Master

7. 算子:對RDD的操作。分為:

1)輸入算子

舉例(parallelize周循、makeRDD强法、textFile、hadoopFile湾笛、wholeTextFiles)

2)transformation算子

3)action算子饮怯,會觸發(fā)一次作業(yè)的提交,為客戶端輸出一個結果或者保存到外部文件系統(tǒng)

舉例 ?(count嚎研、collect蓖墅、reduce、take临扮、first论矾、fold、saveAsTextFile杆勇、saveAsHadoopFile)?

或者數(shù)據(jù)庫系統(tǒng)中(判斷依據(jù)是底層調用sc.runjob代碼)

4)控制算子(persist贪壳、checkpoint(切斷RDD之前的依賴關系))

8. job: rdd的一系列操作算子構成一個job,在excutor中執(zhí)行。

? ? ? ? action算子決定一個job的界限蚜退, 一個Job被拆分成若干個Stage闰靴,每個Stage執(zhí)行一些計算彪笼,產生一些中間結果,最終生成這個Job的計算結果传黄。

9. Stage:每個Job會根據(jù)RDD的寬依賴關系被切分很多Stage杰扫, 每個Stage中包含一組相同的Task, 這一組Task也叫TaskSet

10.? Task:一個分區(qū)對應一個Task膘掰,Task執(zhí)行RDD中對應Stage中包含的算子章姓。Task被封裝好后放入Executor的線程池中執(zhí)行

11. DAGScheduler:根據(jù)Job構建基于Stage的DAG,并提交Stage給TaskScheduler

12. TaskScheduler:將Taskset提交給Worker node集群運行并返回結果

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末识埋,一起剝皮案震驚了整個濱河市凡伊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌窒舟,老刑警劉巖系忙,帶你破解...
    沈念sama閱讀 218,858評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異惠豺,居然都是意外死亡银还,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評論 3 395
  • 文/潘曉璐 我一進店門洁墙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛹疯,“玉大人,你說我怎么就攤上這事热监∞嘞遥” “怎么了?”我有些...
    開封第一講書人閱讀 165,282評論 0 356
  • 文/不壞的土叔 我叫張陵孝扛,是天一觀的道長列吼。 經(jīng)常有香客問我,道長苦始,這世上最難降的妖魔是什么寞钥? 我笑而不...
    開封第一講書人閱讀 58,842評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮陌选,結果婚禮上凑耻,老公的妹妹穿的比我還像新娘。我一直安慰自己柠贤,他們只是感情好,可當我...
    茶點故事閱讀 67,857評論 6 392
  • 文/花漫 我一把揭開白布类缤。 她就那樣靜靜地躺著臼勉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪餐弱。 梳的紋絲不亂的頭發(fā)上宴霸,一...
    開封第一講書人閱讀 51,679評論 1 305
  • 那天囱晴,我揣著相機與錄音,去河邊找鬼瓢谢。 笑死畸写,一個胖子當著我的面吹牛,可吹牛的內容都是我干的氓扛。 我是一名探鬼主播枯芬,決...
    沈念sama閱讀 40,406評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼采郎!你這毒婦竟也來了千所?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,311評論 0 276
  • 序言:老撾萬榮一對情侶失蹤蒜埋,失蹤者是張志新(化名)和其女友劉穎淫痰,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體整份,經(jīng)...
    沈念sama閱讀 45,767評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡待错,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了烈评。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片火俄。...
    茶點故事閱讀 40,090評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖础倍,靈堂內的尸體忽然破棺而出烛占,到底是詐尸還是另有隱情,我是刑警寧澤沟启,帶...
    沈念sama閱讀 35,785評論 5 346
  • 正文 年R本政府宣布忆家,位于F島的核電站,受9級特大地震影響德迹,放射性物質發(fā)生泄漏芽卿。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,420評論 3 331
  • 文/蒙蒙 一胳搞、第九天 我趴在偏房一處隱蔽的房頂上張望卸例。 院中可真熱鬧,春花似錦肌毅、人聲如沸筷转。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽呜舒。三九已至,卻和暖如春笨奠,著一層夾襖步出監(jiān)牢的瞬間袭蝗,已是汗流浹背唤殴。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留到腥,地道東北人朵逝。 一個月前我還...
    沈念sama閱讀 48,298評論 3 372
  • 正文 我出身青樓,卻偏偏與公主長得像乡范,于是被迫代替她去往敵國和親配名。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,033評論 2 355

推薦閱讀更多精彩內容