一、大數(shù)據(jù)的定義
??????? 大數(shù)據(jù)=5V+1C
??????? 5V:variety(多樣化),volume(海量),velocity(快速),vitality(靈活),value(價值)
??????? 1C:complexity(復(fù)雜性)
二、hadoop的定義
?????? 廣義:以hadoop為主的生態(tài)圈岛请,包括hadoop沫浆,flume......
?????? 狹義:hadoop=Apache hadoop——網(wǎng)址:hadoop.apache.org
三、hadoop的三大組件
???????三大組件:存儲洲尊、計算远豺、資源和作業(yè)調(diào)度
?????? hadoop的三個版本:hadoop1.x,hadoop2.x坞嘀,hadoop3.x
?????? hadoop1.x:HDFS(存儲)+MapReduce(計算躯护、資源和作業(yè)調(diào)度)
?????? hadoop2.x:HDFS(存儲)+MapReduce(計算)+YARN(資源和作業(yè)調(diào)度平臺)
注:目前企業(yè)多用hadoop2.x,HDFS和MapReduce都是跑在YARN平臺上姆吭。