MapReducer之Combiner(歸約處理)

Commbiner相當于本地的Reducer計算模式想暗,但是并不是所有場合都適合嚷量,總結(jié)一下都是什么場合適合用镇饮。


作用

因為Map產(chǎn)生了太多的輸出取逾,為了減少RPC傳輸耗绿,在本地進行一次類似于Reduce操作,進行累加砾隅,再將累加的值傳給Reduce误阻。

注意:因為Combiner是可插拔的,所以添加Combiner不能影響最終的計算機過,Combiner應(yīng)該適用于那些究反,Reduce輸入和輸出key/value類型完全一致的寻定,且不影響最終結(jié)果的。

WordCount實例

public class TestCombinerForAvgMR {

//Map對不同文件不同月份進行統(tǒng)計

? ? public static class ForMapextends Mapper {

Textokey =new Text();

AvgEntityavgEntity =new AvgEntity();

@Override

? ? ? ? protected void map(LongWritable key, Text value, Context context)throws IOException, InterruptedException {

String []line = value.toString().split(" ");

okey.set(line[0]);

avgEntity.setCount(1);

avgEntity.setSum(Integer.parseInt(line[1]));

context.write(okey,avgEntity);

}

}

//Combiner對每個月份的進行累加

? ? public static class ForCombinextends Reducer {

@Override

? ? ? ? protected void reduce(Text key, Iterable values, Context context)throws IOException, InterruptedException {

int sum =0;

int count =0;

for (AvgEntity avgEntity:values){

sum += avgEntity.getSum();

count += avgEntity.getCount();

}

AvgEntity avgEntity =new AvgEntity();

avgEntity.setSum(sum);

avgEntity.setCount(count);

context.write(key,avgEntity);

}

}

//將月份合并進行累加,做除法

? ? public static class ForReduceextends Reducer{

@Override

? ? ? ? protected void reduce(Text key, Iterable values, Context context)throws IOException, InterruptedException {

int sum =0;

int count =0;

for(AvgEntity avgEntity : values){

sum += avgEntity.getCount();

count += avgEntity.getSum();

}

context.write(key,new IntWritable(sum/count));

}

}

public static void main(String[] args)throws IOException, ClassNotFoundException, InterruptedException {

Job job = Job.getInstance(new Configuration());

job.setMapperClass(ForMap.class);

job.setReducerClass(ForReduce.class);

job.setCombinerClass(ForCombin.class);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(AvgEntity.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

FileInputFormat.setInputPaths(job,new Path("目錄"));

FileOutputFormat.setOutputPath(job,new Path("目錄"));

job.waitForCompletion(true);


? ? }

問題總結(jié)

1.為什么需要在Mapper端進行歸約處理

? ??因為在Mapper進行歸約后精耐,數(shù)據(jù)量變小了狼速,這樣再通過網(wǎng)絡(luò)傳輸時,傳輸時間就變短了卦停,減少了整個作業(yè)的運行時間向胡。

2.為什么可以在Mapper端進行歸約處理

? ??因為Reducer端接收的數(shù)據(jù)就是來自于Mapper端。我們在Mapper進行歸約處理惊完,無非就是把歸約操作提前到Mapper端做而已僵芹。

3.既然在Mapper端進行了歸約處理,為什么還要在Reducer端進行處理小槐。

????因為Mapper端只處理了本節(jié)點的數(shù)據(jù)拇派,而Reduce端處理的是來自多個Mapper端的數(shù)據(jù),因此有些在Mapper端不能歸約的數(shù)據(jù)凿跳,在Reducer端可以進行歸約件豌。

4.求平均數(shù)(SVG)的非關(guān)聯(lián)操作場景如何減少I/O傳輸量

? ? 更改Mapper端使其輸出兩列數(shù)據(jù)分別是數(shù)值個數(shù)count和平均數(shù)avg,這樣在Reducer端累加count作為總的數(shù)值個數(shù)拄显,輸出計數(shù)和平均值苟径。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市躬审,隨后出現(xiàn)的幾起案子棘街,更是在濱河造成了極大的恐慌,老刑警劉巖承边,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件遭殉,死亡現(xiàn)場離奇詭異,居然都是意外死亡博助,警方通過查閱死者的電腦和手機险污,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來富岳,“玉大人蛔糯,你說我怎么就攤上這事〗咽剑” “怎么了蚁飒?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵,是天一觀的道長萝喘。 經(jīng)常有香客問我淮逻,道長琼懊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任爬早,我火速辦了婚禮哼丈,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘筛严。我一直安慰自己醉旦,他們只是感情好,可當我...
    茶點故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布脑漫。 她就那樣靜靜地躺著髓抑,像睡著了一般。 火紅的嫁衣襯著肌膚如雪优幸。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天褪猛,我揣著相機與錄音网杆,去河邊找鬼。 笑死伊滋,一個胖子當著我的面吹牛碳却,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播笑旺,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼昼浦,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了筒主?” 一聲冷哼從身側(cè)響起关噪,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎乌妙,沒想到半個月后使兔,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡藤韵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年虐沥,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片泽艘。...
    茶點故事閱讀 38,605評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡欲险,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出匹涮,到底是詐尸還是另有隱情天试,我是刑警寧澤,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布焕盟,位于F島的核電站秋秤,受9級特大地震影響宏粤,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜灼卢,卻給世界環(huán)境...
    茶點故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一绍哎、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧鞋真,春花似錦崇堰、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至檩互,卻和暖如春特幔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背闸昨。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工蚯斯, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人饵较。 一個月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓拍嵌,卻偏偏與公主長得像,于是被迫代替她去往敵國和親循诉。 傳聞我的和親對象是個殘疾皇子横辆,可洞房花燭夜當晚...
    茶點故事閱讀 43,472評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 摘自:http://staticor.io/post/hadoop/2016-01-23hadoop-defini...
    wangliang938閱讀 583評論 0 1
  • MapReduce編程重點把握 MapReduce核心概念 思考幾個問題 詞頻統(tǒng)計wordcount的具體執(zhí)行過程...
    胖胖的大羅閱讀 716評論 0 1
  • 前段時間,見微信朋友圈茄猫,有人發(fā)石開先生前些年的狈蚤,硬筆手書 發(fā)言稿,稿上寫著關(guān)于劉...
    歸一堂閱讀 373評論 0 3
  • 如果沒有去追求一件事或者一個人 就會像沒有活過 比如十五歲之前的我 和2016上半年的我 不過現(xiàn)在就是追求的太多 ...
    heim_dn閱讀 315評論 0 0
  • 立春了募疮,還有些凜冽的風里炫惩,陽光懶洋洋的照弗著萬物。這個冬天里這個即將到來的春節(jié)阿浓,我又是第幾個年頭沒準備回老...
    良舍公社閱讀 630評論 2 50