hbase與hive的聯(lián)系
1.hive適合處理離線的數(shù)據(jù)
2.hbase適合處理實(shí)時(shí)的數(shù)據(jù)的查詢
兩者合并起來使用可以達(dá)到‘+’的效果
hive
hive適合用于網(wǎng)絡(luò)日志等數(shù)據(jù)量大的靜態(tài)數(shù)據(jù)查詢
HIVE是hadoop的數(shù)據(jù)倉庫两疚,依賴于HDFS和mapreduce
類似于SQL操作
把MAPREDUCE的程序作為插件來支持HIVE的數(shù)據(jù)分析
作用于全表掃描使用(HIVE+HADOOP)
hive的操作是基于整個(gè)數(shù)據(jù)表的脆霎、
所以查詢起來常常是以小時(shí)來計(jì)
不支持常規(guī)的更新語句赡磅,插入,更新,刪除
hbase
hbase適合大數(shù)據(jù)的實(shí)時(shí)查詢
是一個(gè)數(shù)據(jù)庫系統(tǒng)眷射,面向列的數(shù)據(jù)庫查詢,有自己的查詢 語句
支持橫向擴(kuò)展,減少成本
由自己的查詢方式妖碉,不用依賴于MAPREDUCE
索引訪問使用(HBASE+HADOOP)
性能
HBASE相對于HIVE是比較高效的多的
HIVE需要使用到HDFS存儲涌庭,要用到MAPREDUCE計(jì)算框架
HBASE需要使用HDFS存放文件,HBASE負(fù)責(zé)組織文件
HIVE需要借助MAPREDUCE來完成HIVE的命令執(zhí)行
相同
hbase與HIVE都是架構(gòu)在HADOOP之上的欧宜,都是用HADOOP作為底層存儲
HBASE優(yōu)點(diǎn)
- 列的動態(tài)增加坐榆,并且列為空就不存儲數(shù)據(jù),節(jié)約存儲空間
- 支持高并發(fā)讀寫操作
HBASE缺點(diǎn)
- 不支持條件查詢冗茸,只支持按照ROWKEY查詢
- 不支持MASTER的故障切換席镀,當(dāng)MASTER宕機(jī),整個(gè)系統(tǒng)就癱瘓掉了
- 只保存字符類型
- 沒有表與表之間的關(guān)系