Hadoop之YARN

舊的MapReduce架構(gòu)

JobTracker:負責資源管理,跟蹤資源消耗和可用性莺匠,作業(yè)生命周期管理(調(diào)度作業(yè)任務(wù)十兢,跟蹤進度,為任務(wù)提供容錯)

TaskTracker:加載或關(guān)閉任務(wù)期贫,定時報告認為狀態(tài)

此架構(gòu)會有以下問題:

JobTracker是MapReduce的集中處理點异袄,存在單點故障

JobTracker完成了太多的任務(wù)玛臂,造成了過多的資源消耗封孙,當MapReduce job 非常多的時候讽营,會造成很大的內(nèi)存開銷。這也是業(yè)界普遍總結(jié)出老Hadoop的MapReduce只能支持4000 節(jié)點主機的上限

在TaskTracker端橱鹏,以map/reduce task的數(shù)目作為資&##x6E90;的表示過于簡單,沒有考慮到cpu/ 內(nèi)存的占用情況挑围,如果兩個大內(nèi)存消耗的task被調(diào)度到了一塊糖荒,很容易出現(xiàn)OOM

在TaskTracker端,把資源強制劃分為map task slot和reduce task slot, 如果當系統(tǒng)中只有map task或者只有reduce task的時候蜘矢,會造成資源的浪費综看,也就集群資源利用的問題

總的來說就是單點問題資源利用率問題

YARN架構(gòu)

YARN就是將JobTracker的職責進行拆分寓搬,將資源管理和任務(wù)調(diào)度監(jiān)控拆分成獨立#x7ACB;的進程:一個全局的資源管理和一個每個作業(yè)的管理(ApplicationMaster) ResourceManager和NodeManager提供了計算資源的分配和管理,而ApplicationMaster則完成應(yīng)用程序的運行

ResourceManager:全局資源管理和任務(wù)調(diào)度

NodeManager:單個節(jié)點的資源管理和監(jiān)控

ApplicationMaster:單個作業(yè)的資源管理和任務(wù)監(jiān)控

Container:資源申請的單位和任務(wù)運行的容器

架構(gòu)對比

YARN架構(gòu)下形成了一個通用的資源管理平臺和一個通用的應(yīng)用計算^#x5E73;臺镣典,避免了舊架構(gòu)的單點問題和資源利用率問題唾琼,同時也讓在其上運行的應(yīng)用不再局限于MapReduce形式

YARN基本流程

1. Job submission

從ResourceManager中獲取一個Application ID 檢查作業(yè)輸出配置锡溯,計算輸入分片 拷貝作業(yè)資源(job jar、配置文件祭饭、分片信息)到HDFS倡蝙,以便后面任務(wù)的執(zhí)行

2. Job initialization

ResourceManager將作業(yè)遞交給Scheduler(有很多調(diào)度算法,一般是根據(jù)優(yōu)先級)Scheduler為作業(yè)分配一個Container,ResourceManager就加載一個application master process并交給NodeManager管理ApplicationMaster主要是創(chuàng)建一系列的監(jiān)控進程來跟蹤作業(yè)的進度品山,同時獲取輸入分片烤低,為每一個分片創(chuàng)建一個Map task和相應(yīng)的reduce task Application Master還決定如何運行作業(yè),如果作業(yè)很衅四佟(可配置),則直接在同一個JVM下運行

3. Task assignment

ApplicationMaster向Resource Manager申請資源(一個個的Container魄懂,指定任務(wù)分配的資源要求)一般是根據(jù)data locality來分配資源

4. Task execution

ApplicationMaster根據(jù)ResourceManager的分配情況闯第,在對應(yīng)的NodeManager中啟動Container 從HDFSN#x4E2D;讀取任務(wù)所需資源(job jar,配置文件等)填帽,然后執(zhí)行該任務(wù)

5. Progress and status update

定時將任務(wù)的進度和狀態(tài)報告給ApplicationMaster Client定時向ApplicationMaster獲取整個任務(wù)的進度和狀態(tài)

6. Job completion

Client定時檢查整個作業(yè)是否完成 作業(yè)完成后咙好,會清空臨時文件、目錄等

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嘹悼,一起剝皮案震驚了整個濱河市层宫,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌萌腿,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,561評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件米死,死亡現(xiàn)場離奇詭異贮庞,居然都是意外死亡,警方通過查閱死者的電腦和手機物喷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人伏伐,你說我怎么就攤上這事〔牡牛” “怎么了吝镣?”我有些...
    開封第一講書人閱讀 157,162評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長闸溃。 經(jīng)常有香客問我拱撵,道長,這世上最難降的妖魔是什么拴测? 我笑而不...
    開封第一講書人閱讀 56,470評論 1 283
  • 正文 為了忘掉前任集索,我火速辦了婚禮,結(jié)果婚禮上务荆,老公的妹妹穿的比我還像新娘。我一直安慰自己毅厚,他們只是感情好浦箱,可當我...
    茶點故事閱讀 65,550評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著咽安,像睡著了一般蓬推。 火紅的嫁衣襯著肌膚如雪妆棒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,806評論 1 290
  • 那天动分,我揣著相機與錄音红选,去河邊找鬼。 笑死坟乾,一個胖子當著我的面吹牛蝶防,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播间学,決...
    沈念sama閱讀 38,951評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼低葫,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了氮采?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,712評論 0 266
  • 序言:老撾萬榮一對情侶失蹤主到,失蹤者是張志新(化名)和其女友劉穎躯概,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體牧牢,經(jīng)...
    沈念sama閱讀 44,166評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡姿锭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,510評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了轮纫。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片焚鲜。...
    茶點故事閱讀 38,643評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡放前,死狀恐怖糯彬,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情似扔,我是刑警寧澤却舀,帶...
    沈念sama閱讀 34,306評論 4 330
  • 正文 年R本政府宣布锤灿,位于F島的核電站,受9級特大地震影響但校,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜术裸,卻給世界環(huán)境...
    茶點故事閱讀 39,930評論 3 313
  • 文/蒙蒙 一亭枷、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧猾编,春花似錦、人聲如沸答倡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽倔既。三九已至鹏氧,卻和暖如春叉存,著一層夾襖步出監(jiān)牢的瞬間度帮,已是汗流浹背稿存。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評論 1 266
  • 我被黑心中介騙來泰國打工瓣履, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留练俐,地道東北人袖迎。 一個月前我還...
    沈念sama閱讀 46,351評論 2 360
  • 正文 我出身青樓燕锥,卻偏偏與公主長得像悯蝉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子鼻由,可洞房花燭夜當晚...
    茶點故事閱讀 43,509評論 2 348

推薦閱讀更多精彩內(nèi)容