大數(shù)據(jù)知識(shí) | hive初識(shí)

hive簡(jiǎn)介

hive架構(gòu)

hive是什么

官網(wǎng)這樣說:https://hive.apache.org/

hive .png

hive是用來解決海量結(jié)構(gòu)化的日志數(shù)據(jù)統(tǒng)計(jì)問題的互订,一般是作為建立在Hadoop上的OLAP數(shù)據(jù)倉(cāng)庫(kù)钧排。它是一個(gè)客戶端,主要是將SQL轉(zhuǎn)化成MR任務(wù),特別適合離線處理刷允。它有著類似于SQL的語法,上手難度小,最特別的是它有著統(tǒng)一的元數(shù)據(jù)管理便于其他組件也可以使用兔毒。

所以hiv產(chǎn)生的很大的原因就是:非java編程者對(duì)hdfs的數(shù)據(jù)做mapreduce操作B辍!育叁!

hive簡(jiǎn)介

Hive : 數(shù)據(jù)倉(cāng)庫(kù)迅脐。(各種數(shù)據(jù)源的數(shù)據(jù)進(jìn)行統(tǒng)一規(guī)整)
Hive:解釋器,編譯器豪嗽,優(yōu)化器等谴蔑。
Hive 運(yùn)行時(shí),元數(shù)據(jù)存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)里面龟梦。(HDFS當(dāng)中所有的數(shù)據(jù)都是文本型數(shù)據(jù)隐锭,沒有字段的映射關(guān)系)

c


hive架構(gòu).png

(1)用戶接口主要有三個(gè):CLI,Client 和 WUI计贰。

  • 其中最常用的是CLI钦睡,CLI啟動(dòng)的時(shí)候赏胚,會(huì)同時(shí)啟動(dòng)一個(gè)Hive副本焊虏。大都是命令行床蜘,用戶體驗(yàn)差
  • Client是Hive的客戶端秽梅,用戶連接至Hive Server权烧。在啟動(dòng) Client模式的時(shí)候构订,需要指出Hive Server所在節(jié)點(diǎn)刊驴,并且在該節(jié)點(diǎn)啟動(dòng)Hive Server捐寥。
  • WUI是通過瀏覽器訪問Hive福贞。

(2)Metastore:Hive將元數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中撩嚼,如mysql、derby(內(nèi)存數(shù)據(jù)庫(kù)挖帘,一般不用)完丽。Hive中的元數(shù)據(jù)包括表的名字,表的列和分區(qū)及其屬性拇舀,表的屬性(是否為外部表等)逻族,表的數(shù)據(jù)所在目錄等。

  • 內(nèi)嵌模式


    內(nèi)嵌模式.png

    內(nèi)嵌模式是Hive Metastore的最簡(jiǎn)單的部署方式骄崩,使用Hive內(nèi)嵌的Derby數(shù)據(jù)庫(kù)來存儲(chǔ)元數(shù)據(jù)聘鳞。但是Derby只能接受一個(gè)Hive會(huì)話的訪問,試圖啟動(dòng)第二個(gè)Hive會(huì)話就會(huì)導(dǎo)致Metastore連接失敗要拂。

  • 本地模式


    本地模式

本地模式是Metastore的默認(rèn)模式(懶人專用模式)抠璃。該模式下,單Hive會(huì)話(一個(gè)Hive 服務(wù)JVM)以組件方式調(diào)用Metastore和Driver脱惰。我們可以采用MySQL作為Metastore的數(shù)據(jù)庫(kù)搏嗡。

  • 遠(yuǎn)程模式


    遠(yuǎn)程模式.png

用于非Java客戶端訪問元數(shù)據(jù)庫(kù),在服務(wù)器端啟動(dòng)MetaStoreServer,客戶端利用Thrift協(xié)議通過MetaStoreServer訪問元數(shù)據(jù)庫(kù)
遠(yuǎn)程模式將Metastore分離出來采盒,成為一個(gè)獨(dú)立的Hive服務(wù)(Metastore服務(wù)還可以部署多個(gè))旧乞。這樣的模式可以將數(shù)據(jù)庫(kù)層完全置于防火墻后,客戶就不再需要用戶名和密碼登錄數(shù)據(jù)庫(kù)磅氨,避免了認(rèn)證信息的泄漏尺栖。

(3)解釋器、編譯器烦租、優(yōu)化器完成HQL查詢語句從詞法分析延赌、語法分析、編譯左权、優(yōu)化以及查詢計(jì)劃的生成。生成的查詢計(jì)劃存儲(chǔ)在HDFS中痴颊,并在隨后有MapReduce調(diào)用執(zhí)行赏迟。

(4)Hive的數(shù)據(jù)存儲(chǔ)在HDFS中,大部分的查詢蠢棱、計(jì)算由MapReduce完成(包含*的查詢锌杀,比如select * from tbl不會(huì)生成MapRedcue任務(wù))

(5)Driver:包含編譯器,優(yōu)化器和執(zhí)行器
接收客戶端請(qǐng)求-->編譯泻仙,解釋糕再,執(zhí)行-->提交給yarn執(zhí)行
Driver 每一個(gè)Hive服務(wù)都需要調(diào)用Driver來完成HQL語句的翻譯和執(zhí)行。通俗地說玉转,Driver就是HQL編譯器突想,它解析和優(yōu)化HQL語句,將其轉(zhuǎn)換成一個(gè)Hive Job(可以是MapReduce究抓,也可以是Spark等其他任務(wù))并提交給Hadoop集群猾担。

(6)Operator


image.png

Hive的架構(gòu)

  • 編譯器將一個(gè)Hive SQL轉(zhuǎn)換操作符
  • 操作符是Hive的最小的處理單元
  • 每個(gè)操作符代表HDFS的一個(gè)操作或者一道MapReduce作業(yè)

Operator

  • Operator都是hive定義的一個(gè)處理過程
    Operator都定義有:
  • protected List <Operator<? extends Serializable >> childOperators;
  • protected List <Operator<? extends Serializable >> parentOperators;
  • protected boolean done; // 初始化值為false
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市刺下,隨后出現(xiàn)的幾起案子绑嘹,更是在濱河造成了極大的恐慌,老刑警劉巖橘茉,帶你破解...
    沈念sama閱讀 218,525評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件工腋,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡畅卓,警方通過查閱死者的電腦和手機(jī)擅腰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來翁潘,“玉大人惕鼓,你說我怎么就攤上這事√拼。” “怎么了箱歧?”我有些...
    開封第一講書人閱讀 164,862評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵矾飞,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我呀邢,道長(zhǎng)洒沦,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,728評(píng)論 1 294
  • 正文 為了忘掉前任价淌,我火速辦了婚禮申眼,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蝉衣。我一直安慰自己括尸,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,743評(píng)論 6 392
  • 文/花漫 我一把揭開白布病毡。 她就那樣靜靜地躺著濒翻,像睡著了一般。 火紅的嫁衣襯著肌膚如雪啦膜。 梳的紋絲不亂的頭發(fā)上有送,一...
    開封第一講書人閱讀 51,590評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音僧家,去河邊找鬼雀摘。 笑死,一個(gè)胖子當(dāng)著我的面吹牛八拱,可吹牛的內(nèi)容都是我干的阵赠。 我是一名探鬼主播,決...
    沈念sama閱讀 40,330評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼肌稻,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼豌注!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起灯萍,我...
    開封第一講書人閱讀 39,244評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤轧铁,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后旦棉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體齿风,經(jīng)...
    沈念sama閱讀 45,693評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,885評(píng)論 3 336
  • 正文 我和宋清朗相戀三年绑洛,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了救斑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,001評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡真屯,死狀恐怖脸候,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤运沦,帶...
    沈念sama閱讀 35,723評(píng)論 5 346
  • 正文 年R本政府宣布泵额,位于F島的核電站,受9級(jí)特大地震影響携添,放射性物質(zhì)發(fā)生泄漏嫁盲。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,343評(píng)論 3 330
  • 文/蒙蒙 一烈掠、第九天 我趴在偏房一處隱蔽的房頂上張望羞秤。 院中可真熱鬧,春花似錦左敌、人聲如沸瘾蛋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽哺哼。三九已至,卻和暖如春奇唤,著一層夾襖步出監(jiān)牢的瞬間幸斥,已是汗流浹背匹摇。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工咬扇, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人廊勃。 一個(gè)月前我還...
    沈念sama閱讀 48,191評(píng)論 3 370
  • 正文 我出身青樓懈贺,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親坡垫。 傳聞我的和親對(duì)象是個(gè)殘疾皇子梭灿,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,955評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容