Hadoop--ReduceTask機制

1）設(shè)置ReduceTask

reducetask的并行度同樣影響整個job的執(zhí)行并發(fā)度和執(zhí)行效率爷辙，但與maptask的并發(fā)數(shù)由切片數(shù)決定不同胚委，Reducetask數(shù)量的決定是可以直接手動設(shè)置：
//默認值是1，手動設(shè)置為4
job.setNumReduceTasks(4);

2）注意

（1）reducetask=0 ，表示沒有reduce階段喜颁，輸出文件個數(shù)和map個數(shù)一致稠氮。
（2）reducetask默認值就是1，所以輸出文件個數(shù)為一個半开。
（3）如果數(shù)據(jù)分布不均勻隔披，就有可能在reduce階段產(chǎn)生數(shù)據(jù)傾斜
（4）reducetask數(shù)量并不是任意設(shè)置，還要考慮業(yè)務(wù)邏輯需求寂拆，有些情況下奢米，需要計算全局匯總結(jié)果，就只能有1個reducetask纠永。
（5）具體多少個reducetask鬓长，需要根據(jù)集群性能而定。
（6）如果分區(qū)數(shù)不是1尝江，但是reducetask為1涉波，是否執(zhí)行分區(qū)過程。答案是：不執(zhí)行分區(qū)過程炭序。因為在maptask的源碼中，執(zhí)行分區(qū)的前提是先判斷reduceNum個數(shù)是否大于1惭聂。不大于1肯定不執(zhí)行。

ReduceTask機制

運行流程詳見 Hadoop--MapReduce執(zhí)行過程
（1）Copy階段：ReduceTask從各個MapTask上遠程拷貝一片數(shù)據(jù)笨觅，并針對某一片數(shù)據(jù)耕腾，如果其大小超過一定閾值，則寫到磁盤上炮温，否則直接放到內(nèi)存中牵舵。
（2）Merge階段：在遠程拷貝數(shù)據(jù)的同時，ReduceTask啟動了兩個后臺線程對內(nèi)存和磁盤上的文件進行合并担巩，以防止內(nèi)存使用過多或磁盤上文件過多没炒。
（3）Sort階段：按照MapReduce語義，用戶編寫reduce()函數(shù)輸入數(shù)據(jù)是按key進行聚集的一組數(shù)據(jù)拳话。為了將key相同的數(shù)據(jù)聚在一起，Hadoop采用了基于排序的策略弃衍。由于各個MapTask已經(jīng)實現(xiàn)對自己的處理結(jié)果進行了局部排序镜盯，因此，ReduceTask只需對所有數(shù)據(jù)進行一次歸并排序即可降允。
（4）Reduce階段：reduce()函數(shù)將計算結(jié)果寫到HDFS上剧董。

Attention Please--文章來自互聯(lián)網(wǎng)資料整理，如有雷同翅楼，純屬李小李抄襲辱挥，如有侵權(quán)請聯(lián)系刪除 From 李小李

最后編輯于：2019.05.12 12:46:00

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市功蜓，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌式撼，老刑警劉巖，帶你破解...
沈念sama閱讀 222,104評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異美浦，居然都是意外死亡，警方通過查閱死者的電腦和手機蹬竖，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,816評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門币厕，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人页衙，你說我怎么就攤上這事同辣。” “怎么了响巢？”我有些...
開封第一講書人閱讀 168,697評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵踪古，是天一觀的道長券腔。經(jīng)常有香客問我纷纫，道長，這世上最難降的妖魔是什么辱魁？我笑而不...
開封第一講書人閱讀 59,836評論 1贊 298
?港島之戀（遺憾婚禮）
正文為了忘掉前任染簇，我火速辦了婚禮，結(jié)果婚禮上锻弓，老公的妹妹穿的比我還像新娘。我一直安慰自己青灼，他們只是感情好，可當我...
茶點故事閱讀 68,851評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布酷勺。她就那樣靜靜地躺著扳躬，像睡著了一般甚亭。火紅的嫁衣襯著肌膚如雪亏狰。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,441評論 1贊 310
城市分裂傳說
那天，我揣著相機與錄音辰斋，去河邊找鬼。笑死够挂，一個胖子當著我的面吹牛藕夫，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播办悟，決...
沈念sama閱讀 40,992評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼病蛉，長吁一口氣：“原來是場噩夢啊……” “哼瑰煎！你這毒婦竟也來了丢间？” 一聲冷哼從身側(cè)響起驹针，我...
開封第一講書人閱讀 39,899評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤柬甥，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后卤橄，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體臂外，經(jīng)...
沈念sama閱讀 46,457評論 1贊 318
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,529評論 3贊 341
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了殖属。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,664評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡外潜，死狀恐怖挠唆，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情碧库，我是刑警寧澤嵌灰，帶...
沈念sama閱讀 36,346評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站沽瞭，受9級特大地震影響驹溃，放射性物質(zhì)發(fā)生泄漏延曙。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 42,025評論 3贊 334
男人毒藥：我在死后第九天來索命
文/蒙蒙一布疙、第九天我趴在偏房一處隱蔽的房頂上張望灵临。院中可真熱鬧儒溉，春花似錦发钝、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,511評論 0贊 24
一樁弒父案锌唾，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至滋捶，卻和暖如春重窟，著一層夾襖步出監(jiān)牢的瞬間惧财，已是汗流浹背巡扇。一陣腳步聲響...
開封第一講書人閱讀 33,611評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留垮衷，地道東北人厅翔。一個月前我還...
沈念sama閱讀 49,081評論 3贊 377
代替公主和親
正文我出身青樓，卻偏偏與公主長得像搀突，于是被迫代替她去往敵國和親刀闷。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,675評論 2贊 359

Hadoop--ReduceTask機制

1）設(shè)置ReduceTask

2）注意

ReduceTask機制

推薦閱讀更多精彩內(nèi)容