mr

分區(qū)

1. 作用用于將數(shù)據(jù)進(jìn)行分類(lèi)

2一個(gè)分區(qū)要對(duì)應(yīng)一個(gè)ReduceTask揖盘,每一個(gè)ReduceTask都會(huì)產(chǎn)生一個(gè)結(jié)果文件

3. ReduceTask的數(shù)量可以多于分區(qū)的數(shù)量

4自定義分區(qū)匹涮,那么需要寫(xiě)一個(gè)類(lèi)繼承Partitioner炮障,然后重寫(xiě)其中的方法

一、數(shù)據(jù)本地化策略

1. 當(dāng)JobTracker收到提交的MR程序之后伊者,會(huì)訪(fǎng)問(wèn)NameNode

2. NameNode會(huì)將文件的描述信息返回給JobTracker

3. JobTracker會(huì)根據(jù)描述信息對(duì)文件進(jìn)行切片英遭。

4. 根據(jù)切片的數(shù)量計(jì)算MapTask的數(shù)量,然后JobTracker將MapTask分配有到對(duì)應(yīng)的Block的節(jié)點(diǎn)上删壮,這個(gè)過(guò)程稱(chēng)之為數(shù)據(jù)本地化策略

.數(shù)據(jù)本地化策略的目的是為了減少網(wǎng)絡(luò)的傳輸

二贪绘、job執(zhí)行流程

1. 客戶(hù)端提交jar包 - hadoop jar xxx.jar 時(shí),校驗(yàn)通過(guò)會(huì)分配一個(gè)job和一個(gè)HDFS地址央碟,將地址返回給客戶(hù)端

2. 客戶(hù)端將程序提交到相應(yīng)的HDFS地址上

3. 提交job,開(kāi)始執(zhí)行MapReduce程序

4. 將job由JobTracker執(zhí)行均函,然后JobTracker將文件進(jìn)行切片亿虽,并且計(jì)算MapTask以及ReduceTask的數(shù)量

5. JobTracker上有了任務(wù),就要進(jìn)行任務(wù)的分配苞也,在分配/領(lǐng)取任務(wù)的時(shí)候洛勉,MapTask要滿(mǎn)足數(shù)據(jù)的本地化;ReduceTask會(huì)分配到相對(duì)空閑的節(jié)點(diǎn)上

6. TaskTracker將jar包下載到對(duì)應(yīng)的節(jié)點(diǎn)上如迟,開(kāi)始執(zhí)行MapTask或者ReduceTask - 體現(xiàn)了邏輯移動(dòng)而數(shù)據(jù)固定的思想

(計(jì)算向數(shù)據(jù)移動(dòng))

7. TaskTracker會(huì)在當(dāng)前節(jié)點(diǎn)上開(kāi)啟一個(gè)JVM子進(jìn)程執(zhí)行MapTask或者ReduceTask收毫,每執(zhí)行完一個(gè)MapTask或者ReduceTask就會(huì)關(guān)閉這個(gè)JVM子進(jìn)程攻走;如果當(dāng)前節(jié)點(diǎn)有多個(gè)MapTask,那么每執(zhí)行一個(gè)MapTask都會(huì)開(kāi)啟一個(gè)JVM子進(jìn)程

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末此再,一起剝皮案震驚了整個(gè)濱河市昔搂,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌输拇,老刑警劉巖摘符,帶你破解...
    沈念sama閱讀 211,376評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異策吠,居然都是意外死亡逛裤,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門(mén)猴抹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)带族,“玉大人,你說(shuō)我怎么就攤上這事蟀给◎觯” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,966評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵坤溃,是天一觀(guān)的道長(zhǎng)拍霜。 經(jīng)常有香客問(wèn)我文虏,道長(zhǎng)诫硕,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,432評(píng)論 1 283
  • 正文 為了忘掉前任叽掘,我火速辦了婚禮汁政,結(jié)果婚禮上道偷,老公的妹妹穿的比我還像新娘。我一直安慰自己记劈,他們只是感情好勺鸦,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,519評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著目木,像睡著了一般换途。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上刽射,一...
    開(kāi)封第一講書(shū)人閱讀 49,792評(píng)論 1 290
  • 那天军拟,我揣著相機(jī)與錄音,去河邊找鬼誓禁。 笑死懈息,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的摹恰。 我是一名探鬼主播辫继,決...
    沈念sama閱讀 38,933評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼怒见,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了姑宽?” 一聲冷哼從身側(cè)響起遣耍,我...
    開(kāi)封第一講書(shū)人閱讀 37,701評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎低千,沒(méi)想到半個(gè)月后配阵,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,143評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡示血,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,488評(píng)論 2 327
  • 正文 我和宋清朗相戀三年棋傍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片难审。...
    茶點(diǎn)故事閱讀 38,626評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡瘫拣,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出告喊,到底是詐尸還是另有隱情麸拄,我是刑警寧澤,帶...
    沈念sama閱讀 34,292評(píng)論 4 329
  • 正文 年R本政府宣布黔姜,位于F島的核電站拢切,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏秆吵。R本人自食惡果不足惜淮椰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,896評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望纳寂。 院中可真熱鬧主穗,春花似錦、人聲如沸毙芜。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,742評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)腋粥。三九已至晦雨,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間隘冲,已是汗流浹背金赦。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留对嚼,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,324評(píng)論 2 360
  • 正文 我出身青樓绳慎,卻偏偏與公主長(zhǎng)得像纵竖,于是被迫代替她去往敵國(guó)和親漠烧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,494評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容