Hive的功能架構(gòu)

Hive簡介

  • hive的起源
    許多公司需要對數(shù)據(jù)進行分析凯旋、存儲乞而。但是mapreduce程序去分析數(shù)據(jù)需要按照八股文格式去編寫代碼路捧,但是當(dāng)時很多公司沒有很多的java程序員检激,并且學(xué)習(xí)mapreduce成本也高。隨后facebook公司開發(fā)了hive领跛,擁有學(xué)習(xí)成本低乏德、入門快的特點;只需要你懂sql語句,不會mapreduce編程也能做大數(shù)據(jù)分析喊括。
  • hive的功能
  1. 可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射成一張表胧瓜,并提供類SQL查詢功能
  2. 可以對數(shù)據(jù)提取轉(zhuǎn)化加載(ETL)
  • hive的特性
  1. Hive是構(gòu)建在Hadoop之上的,所有數(shù)據(jù)都是存儲在HDFS中郑什。
  2. 分析查詢SQL語句被轉(zhuǎn)化為MapReduce任務(wù)在Hadoop框架中運行府喳。
  3. Hive的執(zhí)行延遲高,不適合做實時的數(shù)據(jù)分析蘑拯。
  4. 靈活性高钝满,可以自定義用戶函數(shù)(UDF)和自定義存儲格式。
  5. 使用HQL作為查詢接口申窘。
  6. 易擴展弯蚜,因為是基于HDFS+MapReduce,集群擴展容易剃法。

Hive架構(gòu)

hive2.png
  1. 用戶接口主要有:CLI,Clinet,WUI三個組成碎捺。Cli(commmand line interface)為命令行接口。Client是Hive的客戶端贷洲,用戶連接至Hive Server收厨。在啟動Client模式的時候,需要指出Hive Server所在節(jié)點优构,并且在該節(jié)點啟動Hive Server诵叁。WUI是通過瀏覽器訪問Hive,使用之前要啟動hwi服務(wù)钦椭。
  2. Meta store是用來存儲Hive的元數(shù)據(jù)黎休,默認元數(shù)據(jù)是存儲在derby關(guān)系型數(shù)據(jù)庫中,但是derby是能同時只有一個實例玉凯,也就是說不能多個命令行接口同時使用势腮,所以可以設(shè)置成mysql。元數(shù)據(jù)其中包括漫仆,數(shù)據(jù)庫和表的hdfs位置捎拯、名稱、列的屬性等信息盲厌。為什么會把元數(shù)據(jù)的存儲設(shè)置為單獨的署照,而不是存儲在HIVE里面?是為了把元數(shù)據(jù)分離出來吗浩,提高了數(shù)據(jù)的安全性和方便管理建芙。
  3. Parser、Optimizer懂扼、Execution分別用來作HQL的解析器禁荸、編譯優(yōu)化右蒲、生成執(zhí)行計劃,然后由MapReduce調(diào)用執(zhí)行赶熟。但是不是所有的HQL命令都會生成mapreduce任務(wù)瑰妄,例如select * from table_name就不會生成。

Hive與關(guān)系型數(shù)據(jù)庫的差別

  1. 在關(guān)系型數(shù)據(jù)庫中映砖,向表中加載數(shù)據(jù)時间坐,因為會涉及到對列鍵索引和對數(shù)據(jù)進行壓縮,會檢查加載的數(shù)據(jù)文件格式是否與表存儲數(shù)據(jù)的格式是否相同邑退,如果不同竹宋,則會加載數(shù)據(jù)失敗。但是Hive在加載數(shù)據(jù)時不會對數(shù)據(jù)格式進行檢查地技,而是在查詢時去檢查蜈七。雖然這樣查詢效率會降低,而且數(shù)據(jù)量很大乓土,與hive只適合離線數(shù)據(jù)存儲分析相對應(yīng)宪潮。
  2. 關(guān)系型數(shù)據(jù)庫可以對表中具體的某一行進行增刪改查操作溯警、索引趣苏、事物,但是hive不支持梯轻,只能覆蓋原數(shù)據(jù)和追加數(shù)據(jù)食磕。因為hive本來是用來應(yīng)對大數(shù)據(jù)分析存儲,對某一行進行操作喳挑,效率會非常的差彬伦。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市伊诵,隨后出現(xiàn)的幾起案子单绑,更是在濱河造成了極大的恐慌,老刑警劉巖曹宴,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件搂橙,死亡現(xiàn)場離奇詭異,居然都是意外死亡笛坦,警方通過查閱死者的電腦和手機区转,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來版扩,“玉大人废离,你說我怎么就攤上這事〗嘎” “怎么了蜻韭?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我湘捎,道長诀豁,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任窥妇,我火速辦了婚禮舷胜,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘活翩。我一直安慰自己烹骨,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布材泄。 她就那樣靜靜地躺著沮焕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪拉宗。 梳的紋絲不亂的頭發(fā)上峦树,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天,我揣著相機與錄音旦事,去河邊找鬼魁巩。 笑死,一個胖子當(dāng)著我的面吹牛姐浮,可吹牛的內(nèi)容都是我干的谷遂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼卖鲤,長吁一口氣:“原來是場噩夢啊……” “哼肾扰!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蛋逾,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤集晚,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后区匣,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體偷拔,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年沉颂,在試婚紗的時候發(fā)現(xiàn)自己被綠了条摸。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,117評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡铸屉,死狀恐怖钉蒲,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情彻坛,我是刑警寧澤顷啼,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布踏枣,位于F島的核電站,受9級特大地震影響钙蒙,放射性物質(zhì)發(fā)生泄漏茵瀑。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一躬厌、第九天 我趴在偏房一處隱蔽的房頂上張望马昨。 院中可真熱鬧,春花似錦扛施、人聲如沸鸿捧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽匙奴。三九已至,卻和暖如春妄荔,著一層夾襖步出監(jiān)牢的瞬間泼菌,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工啦租, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留哗伯,地道東北人。 一個月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓刷钢,卻偏偏與公主長得像笋颤,于是被迫代替她去往敵國和親乳附。 傳聞我的和親對象是個殘疾皇子内地,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,060評論 2 355

推薦閱讀更多精彩內(nèi)容