四敞嗡、Hive和數(shù)據(jù)庫的區(qū)別
(1)數(shù)據(jù)存儲位置不同
Hive中處理的結(jié)構(gòu)化數(shù)據(jù)存儲在HDFS中,元數(shù)據(jù)存儲在mysql的Meta store中蔫饰;
數(shù)據(jù)庫將數(shù)據(jù)保存在塊設(shè)備或本地文件系統(tǒng)中疗锐;
(2)數(shù)據(jù)更新
Hive是針對數(shù)據(jù)倉庫設(shè)計的,主要用于讀搔耕,所有的數(shù)據(jù)在加載時已經(jīng)確定好隙袁,適合處理靜態(tài)數(shù)據(jù)痰娱;
數(shù)據(jù)庫通常是實(shí)時進(jìn)行修改的,增刪改查菩收,適合處理動態(tài)數(shù)據(jù)梨睁;
(3)執(zhí)行機(jī)制
Hive大多數(shù)查詢的執(zhí)行是通過Hadoop提供的MapReduce實(shí)現(xiàn)的;
數(shù)據(jù)庫通常是用自己的引擎innodb娜饵;
(4)執(zhí)行延遲
Hive因?yàn)闆]有索引坡贺、利用MapReduce框架執(zhí)行查詢,所以Hive本身的延遲較高箱舞;
數(shù)據(jù)庫的延遲較低遍坟,但是不太適合處理PB級別以上海量數(shù)據(jù);
處理海量數(shù)據(jù)時晴股,Hive的優(yōu)勢就顯出來了愿伴;
(5)可擴(kuò)展性
Hive是建立在Hadoop上的,所以Hive也具備可擴(kuò)展性电湘,并發(fā)運(yùn)行隔节;
數(shù)據(jù)庫由于ACID語義的嚴(yán)格限制,擴(kuò)展性非常有限胡桨,例如目前最先進(jìn)的并行數(shù)據(jù)庫oracle在理論上擴(kuò)展能力也就只有100臺左右官帘。
很明顯瞬雹,除了都用sql語句昧谊,Hive和數(shù)據(jù)庫其實(shí)沒啥太大關(guān)系。
————————————————
版權(quán)聲明:本文為CSDN博主「攻城獅Kevin」的原創(chuàng)文章酗捌,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議呢诬,轉(zhuǎn)載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/wx1528159409/java/article/details/84667658