大數(shù)據(jù)hadoop生態(tài)體系之MapReduce快速入門(11)

MapReduce:分布式計算系統(tǒng),hadoop的三大核心功能之一磨总。

MapReduce是面向大數(shù)據(jù)并行處理的計算模型嗦明、框架和平臺,它隱含了以下三層含義:

1)MapReduce是一個基于集群的高性能并行計算平臺(Cluster Infrastructure)蚪燕。它允許用市場上普通的商用服務(wù)器構(gòu)成一個包含數(shù)十娶牌、數(shù)百至數(shù)千個節(jié)點的分布和并行計算集群。

2)MapReduce是一個并行計算與運行軟件框架(Software Framework)馆纳。它提供了一個龐大但設(shè)計精良的并行計算軟件框架诗良,能自動完成計算任務(wù)的并行化處理,自動劃分計算數(shù)據(jù)和計算任務(wù)鲁驶,在集群節(jié)點上自動分配和執(zhí)行任務(wù)以及收集計算結(jié)果鉴裹,將數(shù)據(jù)分布存儲、數(shù)據(jù)通信、容錯處理等并行計算涉及到的很多系統(tǒng)底層的復(fù)雜細節(jié)交由系統(tǒng)負責處理径荔,大大減少了軟件開發(fā)人員的負擔督禽。

3)MapReduce是一個并行程序設(shè)計模型與方法(Programming Model & Methodology)。它借助于函數(shù)式程序設(shè)計語言Lisp的設(shè)計思想总处,提供了一種簡便的并行程序設(shè)計方法狈惫,用Map和Reduce兩個函數(shù)編程實現(xiàn)基本的并行計算任務(wù),提供了抽象的操作和并行編程接口鹦马,以簡單方便地完成大規(guī)模數(shù)據(jù)的編程和計算處理

由來:

MapReduce最早是由Google公司研究提出的一種面向大規(guī)模數(shù)據(jù)處理的并行計算模型和方法胧谈。Google公司設(shè)計MapReduce的初衷主要是為了解決其搜索引擎中大規(guī)模網(wǎng)頁數(shù)據(jù)的并行化處理。Google公司發(fā)明了MapReduce之后首先用其重新改寫了其搜索引擎中的Web文檔索引處理系統(tǒng)荸频。但由于MapReduce可以普遍應(yīng)用于很多大規(guī)模數(shù)據(jù)的計算問題菱肖,因此自發(fā)明MapReduce以后,Google公司內(nèi)部進一步將其廣泛應(yīng)用于很多大規(guī)模數(shù)據(jù)處理問題试溯。Google公司內(nèi)有上萬個各種不同的算法問題和程序都使用MapReduce進行處理蔑滓。

MapReduce實現(xiàn)案例圖示:

實現(xiàn)原理:

1> 通過map接口方法,把讀取文件塊的一行信息遇绞,再通過特定的符號键袱,對改行信息進行分割,把每個單詞作為以鍵值對的形式存入到上下文中摹闽,

單詞作為key蹄咖,value為1 ,每讀取一個單間進行一次寫入付鹿,然后再把相同的key的value以集合的形式傳入到reduce方法中進行計算

2> 通過reduce方法獲取到shuffle之后的數(shù)據(jù)澜汤,每次計算一個相同key的所有的value值,實現(xiàn)統(tǒng)計操作舵匾,然后再寫入到上下文輸入到文件中俊抵。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市坐梯,隨后出現(xiàn)的幾起案子徽诲,更是在濱河造成了極大的恐慌,老刑警劉巖吵血,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件谎替,死亡現(xiàn)場離奇詭異,居然都是意外死亡蹋辅,警方通過查閱死者的電腦和手機钱贯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來侦另,“玉大人秩命,你說我怎么就攤上這事尉共。” “怎么了硫麻?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵爸邢,是天一觀的道長。 經(jīng)常有香客問我拿愧,道長,這世上最難降的妖魔是什么碌尔? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任浇辜,我火速辦了婚禮,結(jié)果婚禮上唾戚,老公的妹妹穿的比我還像新娘柳洋。我一直安慰自己,他們只是感情好叹坦,可當我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布熊镣。 她就那樣靜靜地躺著,像睡著了一般募书。 火紅的嫁衣襯著肌膚如雪绪囱。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天莹捡,我揣著相機與錄音鬼吵,去河邊找鬼。 笑死篮赢,一個胖子當著我的面吹牛齿椅,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播启泣,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼涣脚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了寥茫?” 一聲冷哼從身側(cè)響起遣蚀,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坠敷,沒想到半個月后醉旦,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體姐帚,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了缘滥。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡于宙,死狀恐怖摩梧,靈堂內(nèi)的尸體忽然破棺而出柴灯,到底是詐尸還是另有隱情,我是刑警寧澤费尽,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布赠群,位于F島的核電站,受9級特大地震影響旱幼,放射性物質(zhì)發(fā)生泄漏查描。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一柏卤、第九天 我趴在偏房一處隱蔽的房頂上張望冬三。 院中可真熱鬧,春花似錦缘缚、人聲如沸勾笆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽窝爪。三九已至,卻和暖如春齐媒,著一層夾襖步出監(jiān)牢的瞬間蒲每,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工里初, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留啃勉,地道東北人。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓双妨,卻偏偏與公主長得像淮阐,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子刁品,可洞房花燭夜當晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容