Hadoop 基本組成結(jié)構(gòu)
- Hadoop HDFS 分布式文件系統(tǒng)
- Map Reduce 分布式離線并行計算框架
- Hadoop YARN 作業(yè)調(diào)度虱咧、集群資源管理的框架
- Hadoop Common 支持其他模塊的工具模塊(Configuration继低、RPC轧膘、序列化機制、日志)
Map Reduce
Map 將原始任務進行拆分
Reduce 將任務的結(jié)果進行合并
MapReduce將分布式的方法進行了封裝,簡化了分布式程序的開發(fā)過程
基本Map Reduce 程序結(jié)構(gòu)
Map 階段
Reduce 階段
Driver 階段
Hadoop 序列化
序列化的作用是將內(nèi)存中的對象轉(zhuǎn)換成字節(jié)序列便于存儲