數(shù)倉(cāng)--Hive-面試之Hive架構(gòu)原理

基礎(chǔ)性的東西务傲,不過(guò)在回答的時(shí)候要能回答出彩來(lái)

什么是Hive

  • Hive是由Facebook開(kāi)源用于解決海量結(jié)構(gòu)化日志的數(shù)據(jù)統(tǒng)計(jì)杏糙;Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射 成一張表,并提供類(lèi)SQL查詢(xún)功能吴攒,底層計(jì)算引擎默認(rèn)為Hadoop的MapReduce(本質(zhì)是將sql轉(zhuǎn)化成mapreduce程序),可以將引擎更換為Spark/Tez砂蔽;

Hive架構(gòu)

Hive架構(gòu).PNG
  • 如圖中所示洼怔,Hive通過(guò)給用戶(hù)提供的一系列交互接口,接收到用戶(hù)的指令(SQL)左驾,使用自己的Driver镣隶,結(jié)合元數(shù)據(jù)(MetaStore),將這些指令翻譯成MapReduce诡右,提交到Hadoop中執(zhí)行安岂,最后,將執(zhí)行返回的結(jié)果輸出到用戶(hù)交互接口帆吻。
  • 1)用戶(hù)接口:Client
    • CLI(hive shell)域那、JDBC/ODBC(java訪(fǎng)問(wèn)hive)、WEBUI(瀏覽器訪(fǎng)問(wèn)hive)
  • 2)元數(shù)據(jù):Metastore
    • 元數(shù)據(jù)包括:表名猜煮、表所屬的數(shù)據(jù)庫(kù)(默認(rèn)是default)次员、表的擁有者、列/分區(qū)字段王带、表的類(lèi)型(是否是外部表)淑蔚、表的數(shù)據(jù)所在目錄等;
      默認(rèn)存儲(chǔ)在自帶的derby數(shù)據(jù)庫(kù)中愕撰,推薦使用MySQL存儲(chǔ)Metastore
    • 推薦學(xué)習(xí)博客 數(shù)倉(cāng)--Hive--元數(shù)據(jù)表結(jié)構(gòu)學(xué)習(xí)
  • 3)Hadoop
    • 使用HDFS進(jìn)行存儲(chǔ)刹衫,使用MapReduce進(jìn)行計(jì)算。
  • 4)驅(qū)動(dòng)器:Driver
    (1)解析器(SQL Parser):將SQL字符串轉(zhuǎn)換成抽象語(yǔ)法樹(shù)AST盟戏,這一步一般都用第三方工具庫(kù)完成绪妹,比如antlr;對(duì)AST進(jìn)行語(yǔ)法分析柿究,比如表是否存在邮旷、字段是否存在、SQL語(yǔ)義是否有誤蝇摸。
    (2)編譯器(Physical Plan):將AST編譯生成邏輯執(zhí)行計(jì)劃婶肩。
    (3)優(yōu)化器(Query Optimizer):對(duì)邏輯執(zhí)行計(jì)劃進(jìn)行優(yōu)化办陷。
    (4)執(zhí)行器(Execution):把邏輯執(zhí)行計(jì)劃轉(zhuǎn)換成可以運(yùn)行的物理計(jì)劃。對(duì)于Hive來(lái)說(shuō)律歼,就是MR/Spark民镜。

Hive優(yōu)點(diǎn)

  • 操作接口采用類(lèi)SQL語(yǔ)法,提供快速開(kāi)發(fā)的能力(簡(jiǎn)單险毁、容易上手)制圈;
  • 避免了去寫(xiě)MapReduce,減少開(kāi)發(fā)人員的學(xué)習(xí)成本畔况;
  • 統(tǒng)一的元數(shù)據(jù)管理鲸鹦,可與impala/spark等共享元數(shù)據(jù);
  • 易擴(kuò)展(HDFS+MapReduce:可以擴(kuò)展集群規(guī)模跷跪;支持自定義函數(shù))馋嗜;

Hive使用場(chǎng)景

  • 數(shù)據(jù)的離線(xiàn)處理;比如:日志分析吵瞻,海量結(jié)構(gòu)化數(shù)據(jù)離線(xiàn)分析…
  • Hive的執(zhí)行延遲比較高葛菇,因此hive常用于數(shù)據(jù)分析的,對(duì)實(shí)時(shí)性要求不高的場(chǎng)合橡羞;
  • Hive優(yōu)勢(shì)在于處理大數(shù)據(jù)眯停,對(duì)于處理小數(shù)據(jù)沒(méi)有優(yōu)勢(shì),因?yàn)镠ive的執(zhí)行延遲比較高卿泽。

Hive的執(zhí)行流程

  • HiveQL通過(guò)CLI/web UI或者thrift 庵朝、 odbc 或 jdbc接口的外部接口提交,經(jīng)過(guò)complier編譯器又厉,運(yùn)用Metastore中的元數(shù)據(jù)進(jìn)行類(lèi)型檢測(cè)和語(yǔ)法分析九府,生成一個(gè)邏輯方案(logical plan),然后通過(guò)簡(jiǎn)單的優(yōu)化處理,產(chǎn)生一個(gè)以有向無(wú)環(huán)圖DAG數(shù)據(jù)結(jié)構(gòu)形式展現(xiàn)的map-reduce任務(wù)覆致。

SQL轉(zhuǎn)化成MapReduce過(guò)程

  • Hive是如何將SQL轉(zhuǎn)化為MapReduce任務(wù)的侄旬,整個(gè)編譯過(guò)程分為六個(gè)階段:
    • 1-Antlr定義SQL的語(yǔ)法規(guī)則,完成SQL詞法煌妈,語(yǔ)法解析儡羔,將SQL轉(zhuǎn)化為抽象語(yǔ)法樹(shù)AST Tree;
    • 2-遍歷AST Tree璧诵,抽象出查詢(xún)的基本組成單元QueryBlock汰蜘;
    • 3-遍歷QueryBlock,翻譯為執(zhí)行操作樹(shù)OperatorTree之宿;
    • 4-邏輯層優(yōu)化器進(jìn)行OperatorTree變換族操,合并不必要的ReduceSinkOperator,減少shuffle數(shù)據(jù)量;
    • 5-遍歷OperatorTree色难,翻譯為MapReduce任務(wù)泼舱;
    • 6-物理層優(yōu)化器進(jìn)行MapReduce任務(wù)的變換,生成最終的執(zhí)行計(jì)劃枷莉。

推薦學(xué)習(xí)博客hive sql語(yǔ)句轉(zhuǎn)換成mapreduce

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末娇昙,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子笤妙,更是在濱河造成了極大的恐慌冒掌,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,406評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蹲盘,死亡現(xiàn)場(chǎng)離奇詭異宋渔,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)辜限,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)严蓖,“玉大人薄嫡,你說(shuō)我怎么就攤上這事】藕” “怎么了毫深?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,711評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀(guān)的道長(zhǎng)毒姨。 經(jīng)常有香客問(wèn)我哑蔫,道長(zhǎng),這世上最難降的妖魔是什么弧呐? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,380評(píng)論 1 293
  • 正文 為了忘掉前任闸迷,我火速辦了婚禮,結(jié)果婚禮上俘枫,老公的妹妹穿的比我還像新娘腥沽。我一直安慰自己,他們只是感情好鸠蚪,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布今阳。 她就那樣靜靜地躺著,像睡著了一般茅信。 火紅的嫁衣襯著肌膚如雪盾舌。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,301評(píng)論 1 301
  • 那天蘸鲸,我揣著相機(jī)與錄音妖谴,去河邊找鬼。 笑死酌摇,一個(gè)胖子當(dāng)著我的面吹牛窖维,可吹牛的內(nèi)容都是我干的榆综。 我是一名探鬼主播,決...
    沈念sama閱讀 40,145評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼铸史,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼鼻疮!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起琳轿,我...
    開(kāi)封第一講書(shū)人閱讀 39,008評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤判沟,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后崭篡,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體挪哄,經(jīng)...
    沈念sama閱讀 45,443評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評(píng)論 3 334
  • 正文 我和宋清朗相戀三年琉闪,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了迹炼。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,795評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡颠毙,死狀恐怖斯入,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蛀蜜,我是刑警寧澤刻两,帶...
    沈念sama閱讀 35,501評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站滴某,受9級(jí)特大地震影響磅摹,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜霎奢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評(píng)論 3 328
  • 文/蒙蒙 一户誓、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧幕侠,春花似錦厅克、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,731評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至窗骑,卻和暖如春女责,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背创译。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,865評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工抵知, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,899評(píng)論 2 370
  • 正文 我出身青樓刷喜,卻偏偏與公主長(zhǎng)得像残制,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子掖疮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評(píng)論 2 354