大數(shù)據(jù)這塊的學(xué)習(xí)豹芯,主要分為兩個(gè)方向。
離線數(shù)據(jù)倉(cāng)庫(kù)
實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)
1.離線數(shù)據(jù)倉(cāng)庫(kù)需要掌握的內(nèi)容為:
? ? Hadoop(HDFS喉酌,MapReduce,YARN)
? ? Hive(重點(diǎn))
? ? Spark(Spark 會(huì)用及了解原理)
? ? Oozie(工具泵喘,會(huì)用即可)
? ?離線數(shù)倉(cāng)建設(shè)(搭建數(shù)倉(cāng)瞭吃,數(shù)倉(cāng)建模規(guī)范,概念的東西涣旨,了解即可)
? ?維度建模(建模方式常用的有范式建模和維度建模歪架,重點(diǎn)關(guān)注維度建模,了解即可)
2.實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)需要掌握的內(nèi)容為:
? ? Hadoop(HDFS霹陡,MapReduce和蚪,YARN)
? ? Kafka(重點(diǎn),消息隊(duì)列要求掌握)
? ? Flink(實(shí)時(shí)計(jì)算框架要求掌握)
? ? HBase(會(huì)用烹棉,了解原理)
? ? Druid(會(huì)用攒霹,了解原理)
? ? 實(shí)時(shí)數(shù)倉(cāng)架構(gòu)(兩種數(shù)倉(cāng)架構(gòu):Lambda架構(gòu)和Kappa架構(gòu),了解即可)
然后需要的語言浆洗,前期基本上 JAVA 就可以了催束。