Hive的功能架構(gòu)

Hive簡介

hive的起源
許多公司需要對數(shù)據(jù)進行分析凯旋、存儲乞而。但是mapreduce程序去分析數(shù)據(jù)需要按照八股文格式去編寫代碼路捧，但是當(dāng)時很多公司沒有很多的java程序員检激，并且學(xué)習(xí)mapreduce成本也高。隨后facebook公司開發(fā)了hive领跛，擁有學(xué)習(xí)成本低乏德、入門快的特點；只需要你懂sql語句，不會mapreduce編程也能做大數(shù)據(jù)分析喊括。
hive的功能

可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射成一張表胧瓜，并提供類SQL查詢功能
可以對數(shù)據(jù)提取轉(zhuǎn)化加載(ETL)

hive的特性

Hive是構(gòu)建在Hadoop之上的，所有數(shù)據(jù)都是存儲在HDFS中郑什。
分析查詢SQL語句被轉(zhuǎn)化為MapReduce任務(wù)在Hadoop框架中運行府喳。
Hive的執(zhí)行延遲高，不適合做實時的數(shù)據(jù)分析蘑拯。
靈活性高钝满，可以自定義用戶函數(shù)(UDF)和自定義存儲格式。
使用HQL作為查詢接口申窘。
易擴展弯蚜，因為是基于HDFS+MapReduce，集群擴展容易剃法。

Hive架構(gòu)

hive2.png

用戶接口主要有:CLI,Clinet,WUI三個組成碎捺。Cli(commmand line interface)為命令行接口。Client是Hive的客戶端贷洲，用戶連接至Hive Server收厨。在啟動Client模式的時候，需要指出Hive Server所在節(jié)點优构，并且在該節(jié)點啟動Hive Server诵叁。WUI是通過瀏覽器訪問Hive，使用之前要啟動hwi服務(wù)钦椭。
Meta store是用來存儲Hive的元數(shù)據(jù)黎休，默認元數(shù)據(jù)是存儲在derby關(guān)系型數(shù)據(jù)庫中，但是derby是能同時只有一個實例玉凯，也就是說不能多個命令行接口同時使用势腮，所以可以設(shè)置成mysql。元數(shù)據(jù)其中包括漫仆，數(shù)據(jù)庫和表的hdfs位置捎拯、名稱、列的屬性等信息盲厌。為什么會把元數(shù)據(jù)的存儲設(shè)置為單獨的署照，而不是存儲在HIVE里面？是為了把元數(shù)據(jù)分離出來吗浩，提高了數(shù)據(jù)的安全性和方便管理建芙。
Parser、Optimizer懂扼、Execution分別用來作HQL的解析器禁荸、編譯優(yōu)化右蒲、生成執(zhí)行計劃，然后由MapReduce調(diào)用執(zhí)行赶熟。但是不是所有的HQL命令都會生成mapreduce任務(wù)瑰妄，例如select * from table_name就不會生成。

Hive與關(guān)系型數(shù)據(jù)庫的差別

在關(guān)系型數(shù)據(jù)庫中映砖，向表中加載數(shù)據(jù)時间坐，因為會涉及到對列鍵索引和對數(shù)據(jù)進行壓縮，會檢查加載的數(shù)據(jù)文件格式是否與表存儲數(shù)據(jù)的格式是否相同邑退，如果不同竹宋，則會加載數(shù)據(jù)失敗。但是Hive在加載數(shù)據(jù)時不會對數(shù)據(jù)格式進行檢查地技，而是在查詢時去檢查蜈七。雖然這樣查詢效率會降低，而且數(shù)據(jù)量很大乓土，與hive只適合離線數(shù)據(jù)存儲分析相對應(yīng)宪潮。
關(guān)系型數(shù)據(jù)庫可以對表中具體的某一行進行增刪改查操作溯警、索引趣苏、事物，但是hive不支持梯轻，只能覆蓋原數(shù)據(jù)和追加數(shù)據(jù)食磕。因為hive本來是用來應(yīng)對大數(shù)據(jù)分析存儲，對某一行進行操作喳挑，效率會非常的差彬伦。

最后編輯于：2017.12.04 06:36:29

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市伊诵，隨后出現(xiàn)的幾起案子单绑，更是在濱河造成了極大的恐慌，老刑警劉巖曹宴，帶你破解...
沈念sama閱讀 219,270評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件搂橙，死亡現(xiàn)場離奇詭異，居然都是意外死亡笛坦，警方通過查閱死者的電腦和手機区转，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,489評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來版扩，“玉大人废离，你說我怎么就攤上這事〗嘎” “怎么了蜻韭？”我有些...
開封第一講書人閱讀 165,630評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我湘捎，道長诀豁，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,906評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任窥妇，我火速辦了婚禮舷胜，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘活翩。我一直安慰自己烹骨，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,928評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布材泄。她就那樣靜靜地躺著沮焕，像睡著了一般。火紅的嫁衣襯著肌膚如雪拉宗。梳的紋絲不亂的頭發(fā)上峦树，一...
開封第一講書人閱讀 51,718評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音旦事，去河邊找鬼魁巩。笑死，一個胖子當(dāng)著我的面吹牛姐浮，可吹牛的內(nèi)容都是我干的谷遂。我是一名探鬼主播，決...
沈念sama閱讀 40,442評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼卖鲤，長吁一口氣：“原來是場噩夢啊……” “哼肾扰！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起蛋逾，我...
開封第一講書人閱讀 39,345評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤集晚，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后区匣，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體偷拔，經(jīng)...
沈念sama閱讀 45,802評論 1贊 317
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,984評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年沉颂，在試婚紗的時候發(fā)現(xiàn)自己被綠了条摸。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,117評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡铸屉，死狀恐怖钉蒲，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情彻坛，我是刑警寧澤顷啼，帶...
沈念sama閱讀 35,810評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布踏枣，位于F島的核電站，受9級特大地震影響钙蒙，放射性物質(zhì)發(fā)生泄漏茵瀑。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,462評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一躬厌、第九天我趴在偏房一處隱蔽的房頂上張望马昨。院中可真熱鬧，春花似錦扛施、人聲如沸鸿捧。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,011評論 0贊 22
一樁弒父案疙渣，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽匙奴。三九已至，卻和暖如春妄荔，著一層夾襖步出監(jiān)牢的瞬間泼菌，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,139評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工啦租，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留哗伯，地道東北人。一個月前我還...
沈念sama閱讀 48,377評論 3贊 373
代替公主和親
正文我出身青樓刷钢，卻偏偏與公主長得像笋颤，于是被迫代替她去往敵國和親乳附。傳聞我的和親對象是個殘疾皇子内地，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,060評論 2贊 355

Hive的功能架構(gòu)

Hive簡介

Hive架構(gòu)

Hive與關(guān)系型數(shù)據(jù)庫的差別

推薦閱讀更多精彩內(nèi)容