mapreduce雜談

mapreduce接觸兩周了,跟剛剛接觸懵逼的狀態(tài)相比局待,現(xiàn)在好像有了更深刻的體會绰姻,體會到大數(shù)據(jù)的牛逼之處,稍微對一些大數(shù)據(jù)相關(guān)的實用案例有點理解官紫。
下面對近期所學(xué)的一些mapreduce的相關(guān)知識稍稍進(jìn)行一個總結(jié)

【1】常見的計算框架

mapreduce              離線計算框架

storm                  流式計算框架(進(jìn)行實時計算)

spark                  內(nèi)存計算框架(進(jìn)行快速計算)      

【2】mapreduce分布式計算的設(shè)計理念
移動計算而不移動數(shù)據(jù)

【3】mapreduce處理的數(shù)據(jù)源和目的地分別是肛宋?
mr所處理的數(shù)據(jù)源和所生成的計算結(jié)果均存儲在HDFS分布式文件系統(tǒng)上

【4】mapreduce的幾個階段

mr1.png
       1> 數(shù)據(jù)源              HDFS

       2>split碎片化          進(jìn)行數(shù)據(jù)碎片

       3>map部分             (分)

       4>shuffing部分         ****重點(合并,排序)

       5>reduce部分          (合)

       6>output               輸出結(jié)果數(shù)據(jù)
MR_01.png

【5】mr離線計算框架

    mr作為計算框架大概可分為三個大模塊(input束世、計算模型酝陈、output);
    input和output是原始數(shù)據(jù)的輸入和結(jié)果數(shù)據(jù)的輸出毁涉,并且數(shù)據(jù)的存儲位置均在HDFS上沉帮;
    而整個環(huán)節(jié)的重點則是計算模型的實現(xiàn),數(shù)據(jù)模型也可細(xì)分為三個模塊階段(map贫堰、shuffle穆壕、reduce),
      >map 分割數(shù)據(jù)
      >shuffle  計算排序
      >reduce  合并數(shù)據(jù)

【6】shuffle階段

        位置:shuffle存在于map和reduce函數(shù)之間其屏,進(jìn)行數(shù)據(jù)的計算和排序
        功能:
                  1:mapp而與reduce的一個中間步驟
                  2:可以把mapper的輸出按照某種key值重新切分成幾份和組合成幾份喇勋,把key值符合某種范圍的輸出并送到特定的reduce函數(shù)去處理
                  3:可以簡化reduce過程
                  4:大多數(shù)功能由框架自動完成

【7】shuffle詳

map(內(nèi)存)數(shù)據(jù)   ——>  partitaion,sort,split to disk ——> disk(磁盤)數(shù)據(jù)

注:
        shuffle的整個過程都在map節(jié)點中,其將map的內(nèi)存輸出數(shù)據(jù)分區(qū)按照partation的規(guī)則偎行,然后機(jī)械能排序川背,再寫入磁盤disk中,(其中partation的
默認(rèn)規(guī)則以hash摸運算為準(zhǔn)蛤袒,當(dāng)然也可以由程序員自行編寫)

【8】partation分區(qū):

        分區(qū)時為了把map的數(shù)據(jù)進(jìn)行負(fù)載均衡熄云,解決數(shù)據(jù)傾斜問題,在分給不同的reduce進(jìn)行計算處理妙真,以避免各個reduce所處理的數(shù)據(jù)大小相差過大

【9】map數(shù)據(jù)不會出現(xiàn)數(shù)據(jù)傾斜皱碘,為什么?

map 的數(shù)據(jù)來源來自于HDFS隐孽,而HDFS的數(shù)據(jù)已經(jīng)將數(shù)據(jù)分為block塊癌椿,默認(rèn)為64M健蕊,
相反reduc是接收數(shù)據(jù)的環(huán)境,所以必須shuffle進(jìn)行數(shù)據(jù)處理踢俄,避免數(shù)據(jù)在進(jìn)入reduce時出現(xiàn)數(shù)據(jù)傾斜問題

【10】mr架構(gòu)

mapreduce也采用主從結(jié)構(gòu):
主:JobTracker
      負(fù)責(zé)調(diào)度分配每一個子任務(wù)task運行于TaskTracker上缩功,如果發(fā)現(xiàn)有失敗的task就重新分配其任務(wù)到其他節(jié)點,每一個hadoop集群中只有一個JobTracker都办,一般運行在master節(jié)點上
從:TaskTracker
     TaskTracker主動與JobTracker通信嫡锌,接收作業(yè),并負(fù)責(zé)直接執(zhí)行每一個任務(wù)琳钉,為了減少網(wǎng)路帶寬势木,TaskTracker最好運行在HDFS的DataNode節(jié)點上
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市歌懒,隨后出現(xiàn)的幾起案子啦桌,更是在濱河造成了極大的恐慌,老刑警劉巖及皂,帶你破解...
    沈念sama閱讀 218,451評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件甫男,死亡現(xiàn)場離奇詭異,居然都是意外死亡验烧,警方通過查閱死者的電腦和手機(jī)板驳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碍拆,“玉大人若治,你說我怎么就攤上這事「谢欤” “怎么了直砂?”我有些...
    開封第一講書人閱讀 164,782評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長浩习。 經(jīng)常有香客問我,道長济丘,這世上最難降的妖魔是什么谱秽? 我笑而不...
    開封第一講書人閱讀 58,709評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮摹迷,結(jié)果婚禮上疟赊,老公的妹妹穿的比我還像新娘。我一直安慰自己峡碉,他們只是感情好近哟,可當(dāng)我...
    茶點故事閱讀 67,733評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鲫寄,像睡著了一般吉执。 火紅的嫁衣襯著肌膚如雪疯淫。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,578評論 1 305
  • 那天戳玫,我揣著相機(jī)與錄音熙掺,去河邊找鬼。 笑死咕宿,一個胖子當(dāng)著我的面吹牛币绩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播府阀,決...
    沈念sama閱讀 40,320評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼缆镣,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了试浙?” 一聲冷哼從身側(cè)響起董瞻,我...
    開封第一講書人閱讀 39,241評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎川队,沒想到半個月后力细,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,686評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡固额,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,878評論 3 336
  • 正文 我和宋清朗相戀三年眠蚂,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片斗躏。...
    茶點故事閱讀 39,992評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡啥箭,死狀恐怖劫拗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤赴肚,帶...
    沈念sama閱讀 35,715評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站乖菱,受9級特大地震影響助币,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜燕雁,卻給世界環(huán)境...
    茶點故事閱讀 41,336評論 3 330
  • 文/蒙蒙 一诞丽、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧拐格,春花似錦僧免、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春浊洞,著一層夾襖步出監(jiān)牢的瞬間牵敷,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評論 1 270
  • 我被黑心中介騙來泰國打工沛申, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留劣领,地道東北人。 一個月前我還...
    沈念sama閱讀 48,173評論 3 370
  • 正文 我出身青樓铁材,卻偏偏與公主長得像尖淘,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子著觉,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,947評論 2 355

推薦閱讀更多精彩內(nèi)容