Hadoop之 MapReduce的原理簡介

近來由于工作的需要,以前學(xué)過的Hadoop又重新回顧了一遍醋闭,為以后更好的了解窄驹,特寫下該文章,以留作筆記证逻,深知操作猛如虎乐埠,先從概念來講起。

流程簡介:

1.重寫?JobConfigurable.configure(JobConf)方法囚企,這個方法需要傳遞一個JobConf參數(shù)<JobConf 描述Map/Reduce如何執(zhí)行的主要接口>丈咐,目的是完成Mapper的任務(wù)初始化工作;

2.之后框架使用IputSplit對每個鍵值對調(diào)用一次?map(WritableComparable, Writable, OutputCollector, Reporter)操作;

3.因?yàn)閿?shù)據(jù)在hadoop上是以塊為單位存儲的龙宏,所以使用Partitioner控制map輸出結(jié)果key的分割棵逊,產(chǎn)生一個個分區(qū),分區(qū)的數(shù)目與一個作業(yè)的reduce任務(wù)的數(shù)目是一樣的银酗;

4.map已經(jīng)將數(shù)據(jù)分組排好之后辆影,shuffle為每個Reducer獲得所有Mapper輸出中與之相關(guān)的分塊;sort按照key的值對Reducer的輸入進(jìn)行分組 黍特;

Shuffle和Sort兩個階段是同時(shí)進(jìn)行的蛙讥,map的輸出也是一邊被取回一邊被合并的;

5.對每個輸入鍵值對調(diào)用一次?reduce(WritableComparable, Iterator, OutputCollector, Reporter)方法衅澈,Reduce任務(wù)的輸出通常是通過調(diào)用?OutputCollector.collect(WritableComparable, Writable)寫入?文件系統(tǒng)的键菱。

6.Reporter報(bào)告進(jìn)度谬墙,設(shè)定應(yīng)用程序級別的狀態(tài)消息今布,更新Counters(計(jì)數(shù)器)经备, 表明進(jìn)程正常;

總結(jié): map對數(shù)據(jù)組進(jìn)行分組排序部默,均勻分布到每個數(shù)據(jù)節(jié)點(diǎn)侵蒙,之后reducer調(diào)用計(jì)算任務(wù)程序,并將最終的計(jì)算結(jié)果輸出傅蹂;


各位看客纷闺,如果發(fā)現(xiàn)有何描述不準(zhǔn)確的,定要指出哦份蝴,相互學(xué)習(xí)犁功,個人博客https://www.onexing.cn

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市婚夫,隨后出現(xiàn)的幾起案子浸卦,更是在濱河造成了極大的恐慌,老刑警劉巖案糙,帶你破解...
    沈念sama閱讀 221,331評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件限嫌,死亡現(xiàn)場離奇詭異,居然都是意外死亡时捌,警方通過查閱死者的電腦和手機(jī)怒医,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,372評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來奢讨,“玉大人稚叹,你說我怎么就攤上這事∧弥睿” “怎么了入录?”我有些...
    開封第一講書人閱讀 167,755評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長佳镜。 經(jīng)常有香客問我僚稿,道長,這世上最難降的妖魔是什么蟀伸? 我笑而不...
    開封第一講書人閱讀 59,528評論 1 296
  • 正文 為了忘掉前任蚀同,我火速辦了婚禮,結(jié)果婚禮上啊掏,老公的妹妹穿的比我還像新娘蠢络。我一直安慰自己,他們只是感情好迟蜜,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,526評論 6 397
  • 文/花漫 我一把揭開白布刹孔。 她就那樣靜靜地躺著,像睡著了一般娜睛。 火紅的嫁衣襯著肌膚如雪髓霞。 梳的紋絲不亂的頭發(fā)上卦睹,一...
    開封第一講書人閱讀 52,166評論 1 308
  • 那天,我揣著相機(jī)與錄音方库,去河邊找鬼结序。 笑死,一個胖子當(dāng)著我的面吹牛纵潦,可吹牛的內(nèi)容都是我干的徐鹤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,768評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼邀层,長吁一口氣:“原來是場噩夢啊……” “哼返敬!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起寥院,我...
    開封第一講書人閱讀 39,664評論 0 276
  • 序言:老撾萬榮一對情侶失蹤救赐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后只磷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體经磅,經(jīng)...
    沈念sama閱讀 46,205評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,290評論 3 340
  • 正文 我和宋清朗相戀三年钮追,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了预厌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,435評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡元媚,死狀恐怖轧叽,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情刊棕,我是刑警寧澤炭晒,帶...
    沈念sama閱讀 36,126評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站甥角,受9級特大地震影響网严,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜嗤无,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,804評論 3 333
  • 文/蒙蒙 一震束、第九天 我趴在偏房一處隱蔽的房頂上張望陶舞。 院中可真熱鬧库说,春花似錦、人聲如沸馋艺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,276評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春侵佃,著一層夾襖步出監(jiān)牢的瞬間麻昼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工趣钱, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人胚宦。 一個月前我還...
    沈念sama閱讀 48,818評論 3 376
  • 正文 我出身青樓首有,卻偏偏與公主長得像,于是被迫代替她去往敵國和親枢劝。 傳聞我的和親對象是個殘疾皇子井联,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,442評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 目的這篇教程從用戶的角度出發(fā),全面地介紹了Hadoop Map/Reduce框架的各個方面您旁。先決條件請先確認(rèn)Had...
    SeanC52111閱讀 1,734評論 0 1
  • 一個Map/Reduce 作業(yè)(job) 通常會把輸入的數(shù)據(jù)(input file)切分為若干獨(dú)立的數(shù)據(jù)塊(spl...
    Alukar閱讀 6,704評論 0 15
  • 例子:首先讓我們先看一個Map/Reduce的應(yīng)用示例烙常,以便對它們的工作方式有一個初步的認(rèn)識。本次DEMO它可以統(tǒng)...
    JeetPan閱讀 3,033評論 0 2
  • MapReduce過程詳解及其性能優(yōu)化 [toc] 轉(zhuǎn)載:MapReduce過程詳解及其性能優(yōu)化 總結(jié) 詳情 從J...
    小小少年Boy閱讀 7,055評論 2 18
  • MapReduce執(zhí)行流程 MapReduce的執(zhí)行步驟 1鹤盒、Map任務(wù)處理 1.1 讀取HDFS中的文件蚕脏。每一行...
    依天立業(yè)閱讀 2,241評論 0 8