Hadoop MapReduce 是Hadoop應(yīng)用層接觸很多的工具者祖,對(duì)于初學(xué)者來(lái)說(shuō)整葡,并不是很容易理解村象。
在此我總結(jié)記錄一些MapReduce常見(jiàn)用法温艇。
Word Counting (global) in MapReduce
這個(gè) word counting 是數(shù)總字?jǐn)?shù)
- 輸入文件分成若干份
- 每一份交給一個(gè)map來(lái)處理逻恐,每個(gè)map得到一個(gè) word count 結(jié)果
- 各個(gè)結(jié)果用 reduce 匯總
Word Counting in MapReduce
這個(gè) word counting 與上一個(gè)不同像吻,是數(shù)每個(gè)字的字?jǐn)?shù)
- 輸入文件分成若干份
- 每一份交給一個(gè)map來(lái)處理,生成結(jié)果 (hello, 1) (word, 2) ...
- 匯總可以按照單詞不同來(lái)進(jìn)行