通俗理解YARN運(yùn)行原理

導(dǎo)語(yǔ):工作中常常和Spark on YARN, Hadoop on YARN打交道堂湖,經(jīng)常在各種日志中摸爬滾打着降,為提升效率侦讨,總結(jié)一下YARN的知識(shí)點(diǎn)窘面,希望能形成一個(gè)比較系統(tǒng)的方法論棠绘。本文由三問(wèn)三答一例組成件相。

1、為什么要使用YARN氧苍?

為了提升集群的利用率夜矗、資源統(tǒng)一管理, 使用YARN為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度的平臺(tái)让虐。

2紊撕、YARN的優(yōu)勢(shì)?

? ??資源的統(tǒng)一管理和調(diào)度:?

????集群中所有節(jié)點(diǎn)的資源(內(nèi)存赡突、CPU对扶、磁盤、網(wǎng)絡(luò)等)抽象為Container惭缰。計(jì)算框架需要資源進(jìn)行運(yùn)算任務(wù)時(shí)需要向YARN申請(qǐng)Container浪南, YARN按照特定的策略對(duì)資源進(jìn)行調(diào)度進(jìn)行Container的分配。

? ??資源隔離:?

????YARN使用了輕量級(jí)資源隔離機(jī)制Cgroups進(jìn)行資源隔離以避免相互干擾漱受,一旦Container使用的資源量超過(guò)事先定義的上限值络凿,就將其殺死。

3昂羡、YARN是如何工作的絮记?

介紹YARN調(diào)度過(guò)程之前,解釋幾個(gè)專用名詞:

Resource Manager:全局資源管理器紧憾,一個(gè)集群只有一個(gè)RM到千。負(fù)責(zé)和AM(Application Master)交互,資源調(diào)度赴穗、資源分配等工作憔四。

Application Master:應(yīng)用程序的管理器,類似項(xiàng)目經(jīng)理般眉,一個(gè)應(yīng)用程序只有一個(gè)AM了赵。負(fù)責(zé)任務(wù)開(kāi)始時(shí)找RM要資源,任務(wù)完成時(shí)向RM注銷自己,釋放資源甸赃;與NM通信以啟動(dòng)/停止任務(wù)柿汛;接收NM同步的任務(wù)進(jìn)度信息。

Node Manager:一臺(tái)機(jī)器上的管理者,類似于部門經(jīng)理络断。管理著本機(jī)上若干小弟Containers的生命周期裁替、監(jiān)視資源和跟蹤節(jié)點(diǎn)健康并定時(shí)上報(bào)給RM;接收并處理來(lái)自AM的Container啟動(dòng)/停止等各種請(qǐng)求貌笨。

Container:一臺(tái)機(jī)器上具體提供運(yùn)算資源弱判,將設(shè)備上的內(nèi)存、CPU锥惋、磁盤昌腰、網(wǎng)絡(luò)等資源封裝在一起的抽象概念——“資源容器”,Container是一個(gè)動(dòng)態(tài)資源分配單位膀跌,為了限定每個(gè)任務(wù)使用的資源量遭商。


NM和Container是一臺(tái)設(shè)備上的不同進(jìn)程

Attempt:提交到Y(jié)arn中的應(yīng)用程序被稱為Application,它可能會(huì)嘗試運(yùn)行多次捅伤,每次的嘗試運(yùn)行稱為“Application Attempt”劫流,如果一次嘗試運(yùn)行失敗,則由RMApp創(chuàng)建另一個(gè)繼續(xù)運(yùn)行暑认,直至達(dá)到失敗次數(shù)的上限困介。

圖片來(lái)自參考[1]

以下通俗地解釋一下向YARN提交一個(gè)應(yīng)用程序時(shí)的執(zhí)行過(guò)程:

1、用戶向YARN提交程序蘸际,以Map Reduce程序?yàn)槔ǎ琑esource Manager(資源管理器)接收到客戶端程序的運(yùn)行請(qǐng)求

2、Resource Manager分配一個(gè)Container(資源)用來(lái)啟動(dòng)Application Master(程序管理員)粮彤,并告知Node Manager(節(jié)點(diǎn)管理員)根穷,要求它在這個(gè)Container下啟動(dòng)Application Master

3、Application Master啟動(dòng)后导坟,向Resource Manager發(fā)起注冊(cè)請(qǐng)求

4屿良、Application Master向Resource Manager申請(qǐng)資源

5、取得資源后惫周,根據(jù)資源尘惧,向相關(guān)的Node Manager通信,要求其啟動(dòng)程序

6递递、Node Manager(多個(gè))啟動(dòng)MR(每個(gè)MR任務(wù)都是一個(gè)job喷橙,可以在job日志中查看程序運(yùn)行日志)

7、Node Manager不斷匯報(bào)MR狀態(tài)和進(jìn)展給Application Master

8登舞、當(dāng)MR全部完成時(shí)贰逾,Application Master向Resource Manager匯報(bào)任務(wù)完成,并注銷自己


下面結(jié)合一個(gè)排錯(cuò)的例子來(lái)介紹日常使用:

在一次提交一個(gè)MR任務(wù)之后菠秒,application失敗退出疙剑。通常會(huì)第一時(shí)間看到application頁(yè)面排查問(wèn)題,這里第一個(gè)紅框是應(yīng)用程序最終狀態(tài),F(xiàn)AILED言缤。錯(cuò)誤發(fā)生立馬看診斷信息有沒(méi)有邏輯錯(cuò)誤信息(程序代碼自身問(wèn)題)嚼蚀,現(xiàn)在看診斷信息顯示是task失敗,排除邏輯錯(cuò)誤轧简。

除去代碼問(wèn)題驰坊,應(yīng)該是環(huán)境變量和job設(shè)置的問(wèn)題,接下來(lái)看任務(wù)運(yùn)行日志哮独,進(jìn)入 Tracking URL: History。

application運(yùn)行情況頁(yè)面

第二個(gè)頁(yè)面察藐,MR的job日志界面皮璧,發(fā)現(xiàn)是Map任務(wù)失敗

MR的job日志界面

第三個(gè)界面,查看具體失敗的attempts情況

從Note顯示的信息判斷是邏輯還是系統(tǒng)失敗分飞,很明顯是系統(tǒng)失敗悴务,再點(diǎn)開(kāi)log查看詳細(xì)信息。

查看具體失敗的attempts情況

發(fā)現(xiàn)是我job設(shè)置的JAVA_HOME出現(xiàn)問(wèn)題譬猫。定位并解決~

環(huán)境變量問(wèn)題

-------------------------

參考文章:

[1]?Yarn(MapReduce2.0)架構(gòu)的資源請(qǐng)求流程(通俗)

[2]yarn-百度百科

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末讯檐,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子染服,更是在濱河造成了極大的恐慌别洪,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,454評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件柳刮,死亡現(xiàn)場(chǎng)離奇詭異挖垛,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)秉颗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門痢毒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人蚕甥,你說(shuō)我怎么就攤上這事哪替。” “怎么了菇怀?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,921評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵凭舶,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我敏释,道長(zhǎng)库快,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,648評(píng)論 1 284
  • 正文 為了忘掉前任钥顽,我火速辦了婚禮义屏,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己闽铐,他們只是感情好蝶怔,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著兄墅,像睡著了一般踢星。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上隙咸,一...
    開(kāi)封第一講書(shū)人閱讀 49,950評(píng)論 1 291
  • 那天沐悦,我揣著相機(jī)與錄音,去河邊找鬼五督。 笑死藏否,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的充包。 我是一名探鬼主播副签,決...
    沈念sama閱讀 39,090評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼基矮!你這毒婦竟也來(lái)了淆储?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,817評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤家浇,失蹤者是張志新(化名)和其女友劉穎本砰,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蓝谨,經(jīng)...
    沈念sama閱讀 44,275評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡灌具,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了譬巫。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咖楣。...
    茶點(diǎn)故事閱讀 38,724評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖芦昔,靈堂內(nèi)的尸體忽然破棺而出诱贿,到底是詐尸還是另有隱情,我是刑警寧澤咕缎,帶...
    沈念sama閱讀 34,409評(píng)論 4 333
  • 正文 年R本政府宣布珠十,位于F島的核電站,受9級(jí)特大地震影響凭豪,放射性物質(zhì)發(fā)生泄漏焙蹭。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評(píng)論 3 316
  • 文/蒙蒙 一嫂伞、第九天 我趴在偏房一處隱蔽的房頂上張望孔厉。 院中可真熱鬧拯钻,春花似錦、人聲如沸撰豺。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,815評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)污桦。三九已至亩歹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間凡橱,已是汗流浹背小作。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,043評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留梭纹,地道東北人躲惰。 一個(gè)月前我還...
    沈念sama閱讀 46,503評(píng)論 2 361
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像变抽,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子氮块,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容

  • YarnYarn產(chǎn)生背景:Yarn直接來(lái)自于MR1.0MR1.0 問(wèn)題:采用的是master slave結(jié)構(gòu)绍载,ma...
    時(shí)待吾閱讀 5,601評(píng)論 2 23
  • 前言: 上節(jié)課我們講了 MR job的提交YARN的工作流程 與 YARN的架構(gòu),本次課程詳細(xì)講講YARN滔蝉,多多總...
    ly稻草閱讀 4,787評(píng)論 0 5
  • 1, YARN概述 YARN是“ Yet Another Resource Negotiator”的簡(jiǎn)稱击儡。在進(jìn)一步...
    Alukar閱讀 1,235評(píng)論 0 3
  • 一、Yarn簡(jiǎn)介 Yarn是Hadoop集群的資源管理系統(tǒng)蝠引。Hadoop2.0對(duì)MapReduce框架做了徹底的設(shè)...
    scottzcw閱讀 5,200評(píng)論 1 8
  • 那一年阳谍,他二十一歲,我十九歲螃概。在剛認(rèn)識(shí)他的很長(zhǎng)一段時(shí)間里矫夯,我一直以為他已經(jīng)有二十八歲了,因?yàn)樗L(zhǎng)得有那么成熟吊洼。而我...
    阿夏麗閱讀 507評(píng)論 2 4