mapreduce雜談

mapreduce接觸兩周了，跟剛剛接觸懵逼的狀態(tài)相比局待，現(xiàn)在好像有了更深刻的體會绰姻，體會到大數(shù)據(jù)的牛逼之處，稍微對一些大數(shù)據(jù)相關(guān)的實用案例有點理解官紫。
下面對近期所學(xué)的一些mapreduce的相關(guān)知識稍稍進(jìn)行一個總結(jié)

【1】常見的計算框架

mapreduce              離線計算框架

storm                  流式計算框架（進(jìn)行實時計算）

spark                  內(nèi)存計算框架（進(jìn)行快速計算）

【2】mapreduce分布式計算的設(shè)計理念
移動計算而不移動數(shù)據(jù)

【3】mapreduce處理的數(shù)據(jù)源和目的地分別是肛宋？
mr所處理的數(shù)據(jù)源和所生成的計算結(jié)果均存儲在HDFS分布式文件系統(tǒng)上

【4】mapreduce的幾個階段

mr1.png

       1> 數(shù)據(jù)源              HDFS

       2>split碎片化          進(jìn)行數(shù)據(jù)碎片

       3>map部分             （分）

       4>shuffing部分         ****重點（合并，排序）

       5>reduce部分          （合）

       6>output               輸出結(jié)果數(shù)據(jù)

MR_01.png

【5】mr離線計算框架

    mr作為計算框架大概可分為三個大模塊（input束世、計算模型酝陈、output）；
    input和output是原始數(shù)據(jù)的輸入和結(jié)果數(shù)據(jù)的輸出毁涉，并且數(shù)據(jù)的存儲位置均在HDFS上沉帮；
    而整個環(huán)節(jié)的重點則是計算模型的實現(xiàn)，數(shù)據(jù)模型也可細(xì)分為三個模塊階段（map贫堰、shuffle穆壕、reduce），
      >map 分割數(shù)據(jù)
      >shuffle  計算排序
      >reduce  合并數(shù)據(jù)

【6】shuffle階段

        位置：shuffle存在于map和reduce函數(shù)之間其屏，進(jìn)行數(shù)據(jù)的計算和排序
        功能：
                  1：mapp而與reduce的一個中間步驟
                  2：可以把mapper的輸出按照某種key值重新切分成幾份和組合成幾份喇勋，把key值符合某種范圍的輸出并送到特定的reduce函數(shù)去處理
                  3：可以簡化reduce過程
                  4：大多數(shù)功能由框架自動完成

【7】shuffle詳

map（內(nèi)存）數(shù)據(jù)   ——>  partitaion,sort,split to disk ——> disk(磁盤)數(shù)據(jù)

注：
        shuffle的整個過程都在map節(jié)點中，其將map的內(nèi)存輸出數(shù)據(jù)分區(qū)按照partation的規(guī)則偎行，然后機(jī)械能排序川背，再寫入磁盤disk中，（其中partation的
默認(rèn)規(guī)則以hash摸運算為準(zhǔn)蛤袒，當(dāng)然也可以由程序員自行編寫）

【8】partation分區(qū)：

        分區(qū)時為了把map的數(shù)據(jù)進(jìn)行負(fù)載均衡熄云，解決數(shù)據(jù)傾斜問題，在分給不同的reduce進(jìn)行計算處理妙真，以避免各個reduce所處理的數(shù)據(jù)大小相差過大

【9】map數(shù)據(jù)不會出現(xiàn)數(shù)據(jù)傾斜皱碘，為什么？

map 的數(shù)據(jù)來源來自于HDFS隐孽，而HDFS的數(shù)據(jù)已經(jīng)將數(shù)據(jù)分為block塊癌椿，默認(rèn)為64M健蕊，
相反reduc是接收數(shù)據(jù)的環(huán)境，所以必須shuffle進(jìn)行數(shù)據(jù)處理踢俄，避免數(shù)據(jù)在進(jìn)入reduce時出現(xiàn)數(shù)據(jù)傾斜問題

【10】mr架構(gòu)

mapreduce也采用主從結(jié)構(gòu)：
主：JobTracker
      負(fù)責(zé)調(diào)度分配每一個子任務(wù)task運行于TaskTracker上缩功，如果發(fā)現(xiàn)有失敗的task就重新分配其任務(wù)到其他節(jié)點，每一個hadoop集群中只有一個JobTracker都办，一般運行在master節(jié)點上
從：TaskTracker
     TaskTracker主動與JobTracker通信嫡锌，接收作業(yè)，并負(fù)責(zé)直接執(zhí)行每一個任務(wù)琳钉，為了減少網(wǎng)路帶寬势木，TaskTracker最好運行在HDFS的DataNode節(jié)點上

最后編輯于：2017.12.04 14:07:22

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市歌懒，隨后出現(xiàn)的幾起案子啦桌，更是在濱河造成了極大的恐慌，老刑警劉巖及皂，帶你破解...
沈念sama閱讀 218,451評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件甫男，死亡現(xiàn)場離奇詭異，居然都是意外死亡验烧，警方通過查閱死者的電腦和手機(jī)板驳，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,172評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來碍拆，“玉大人若治，你說我怎么就攤上這事「谢欤” “怎么了直砂？”我有些...
開封第一講書人閱讀 164,782評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長浩习。經(jīng)常有香客問我，道長济丘，這世上最難降的妖魔是什么谱秽？我笑而不...
開封第一講書人閱讀 58,709評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮摹迷，結(jié)果婚禮上疟赊，老公的妹妹穿的比我還像新娘。我一直安慰自己峡碉，他們只是感情好近哟，可當(dāng)我...
茶點故事閱讀 67,733評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著鲫寄，像睡著了一般吉执。火紅的嫁衣襯著肌膚如雪疯淫。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,578評論 1贊 305
城市分裂傳說
那天戳玫，我揣著相機(jī)與錄音熙掺，去河邊找鬼。笑死咕宿，一個胖子當(dāng)著我的面吹牛币绩，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播府阀，決...
沈念sama閱讀 40,320評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼缆镣，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了试浙？” 一聲冷哼從身側(cè)響起董瞻，我...
開封第一講書人閱讀 39,241評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎川队，沒想到半個月后力细，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,686評論 1贊 314
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡固额，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,878評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年眠蚂，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片斗躏。...
茶點故事閱讀 39,992評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡啥箭，死狀恐怖劫拗，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤赴肚，帶...
沈念sama閱讀 35,715評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站乖菱，受9級特大地震影響助币，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜燕雁，卻給世界環(huán)境...
茶點故事閱讀 41,336評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一诞丽、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧拐格，春花似錦僧免、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,912評論 0贊 22
一樁弒父案懂衩，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春浊洞，著一層夾襖步出監(jiān)牢的瞬間牵敷，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,040評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工沛申，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留劣领，地道東北人。一個月前我還...
沈念sama閱讀 48,173評論 3贊 370
代替公主和親
正文我出身青樓铁材，卻偏偏與公主長得像尖淘，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子著觉，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,947評論 2贊 355

mapreduce雜談

推薦閱讀更多精彩內(nèi)容