1.Hive
(1) 數(shù)據(jù)倉(cāng)庫(kù)
Hive 的本質(zhì)其實(shí)就相當(dāng)于將 HDFS 中已經(jīng)存儲(chǔ)的文件在 Mysql 中做了一個(gè)雙射關(guān)系苟蹈,以方便使用 HQL 去管理查詢(xún)挽荠。
(2) 用于數(shù)據(jù)分析喝峦、清洗
Hive 適用于離線(xiàn)的數(shù)據(jù)分析和清洗,延遲較高吓妆。
(3) 基于 HDFS砾隅、MapReduce
Hive 存儲(chǔ)的數(shù)據(jù)依舊在 DataNode 上熬甫,編寫(xiě)的 HQL 語(yǔ)句終將是轉(zhuǎn)換為 MapReduce 代碼執(zhí)行熔掺。
2.HBase
(1) 數(shù)據(jù)庫(kù)
是一種面向列存儲(chǔ)的非關(guān)系型數(shù)據(jù)庫(kù)。
(2) 用于存儲(chǔ)結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)
適用于單表非關(guān)系型數(shù)據(jù)的存儲(chǔ)究反,不適合做關(guān)聯(lián)查詢(xún)聂喇,類(lèi)似 JOIN 等操作辖源。
(3) 基于 HDFS
數(shù)據(jù)持久化存儲(chǔ)的體現(xiàn)形式是 Hfile,存放于 DataNode 中希太,被 ResionServer 以 region
的形式進(jìn)行管理克饶。
(4) 延遲較低,接入在線(xiàn)業(yè)務(wù)使用
面對(duì)大量的企業(yè)數(shù)據(jù)誊辉,HBase 可以直線(xiàn)單表大量數(shù)據(jù)的存儲(chǔ)矾湃,同時(shí)提供了高效的數(shù)據(jù)訪問(wèn)速度。