教程簡介
MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。概念"Map(映射)"和"Reduce(歸約)",是它們的主要思想充易,都是從函數(shù)式編程語言里借來的,還有從矢量編程語言里借來的特性荸型。它極大地方便了編程人員在不會(huì)分布式并行編程的情況下盹靴,將自己的程序運(yùn)行在分布式系統(tǒng)上。 當(dāng)前的軟件實(shí)現(xiàn)是指定一個(gè)Map(映射)函數(shù)帆疟,用來把一組鍵值對映射成一組新的鍵值對鹉究,指定并發(fā)的Reduce(歸約)函數(shù)宇立,用來保證所有映射的鍵值對中的每一個(gè)共享相同的鍵組踪宠。
MapReduce入門教程 - 從簡單的步驟了解MapReduce,從基本到高級(jí)概念妈嘹,包括簡介柳琢,算法,安裝润脸,API柬脸,Hadoop中的實(shí)現(xiàn),分區(qū)器毙驯,組合器倒堕,Hadoop管理。
教程目錄
- MapReduce教程
- MapReduce - 簡介
- MapReduce - 算法
- MapReduce - 安裝
- MapReduce - API
- MapReduce - Hadoop實(shí)現(xiàn)
- MapReduce - 分區(qū)程序
- MapReduce - 組合器
- MapReduce - Hadoop管理
- MapReduce - 有用的資源