map reduce1的任務(wù)處理流程
- 輸入數(shù)據(jù)
- 數(shù)據(jù)分片
- map處理
-
map shuffle(混淆)
collector -> 緩沖區(qū) ->到達閾值就sortAndSpill磁盤 ->merge
5 combine(本地的reduce橱鹏, 不是什么統(tǒng)計都能用combine)
- reduce shuffle
復制map輸出(先復制到內(nèi)存,超過閾值就flush磁盤)->排序合并
- reduce
- 輸出數(shù)據(jù)