Hive基礎(chǔ)(二)-hive的基本概念

2.hive的基本概念

1.hive的概念

hive:是hadoop的一個數(shù)據(jù)倉庫票髓。提供了一個類sql的功能,通過寫一個sql語句完成數(shù)據(jù)的分析掷空。

  • 將結(jié)構(gòu)化的數(shù)據(jù)映射成一張表
  • 結(jié)構(gòu)化數(shù)據(jù): 存有關(guān)系的數(shù)據(jù)(關(guān)系型數(shù)據(jù)庫)肋殴、有一定規(guī)則的文本
  • 半結(jié)構(gòu)化數(shù)據(jù):非關(guān)系模型的囤锉、有基本固定結(jié)構(gòu)模式的數(shù)據(jù),例如日志文件护锤、XML文檔官地、JSON文檔、Email等烙懦。
  • 非結(jié)構(gòu)化數(shù)據(jù):沒有固定模式的數(shù)據(jù)驱入,如WORD、PDF氯析、PPT亏较、EXL,各種格式的圖片掩缓、視頻等雪情。

hive本身不存儲數(shù)據(jù),數(shù)據(jù)存儲到hdfs上拾因,當(dāng)執(zhí)行sql語句的時候旺罢,實際是將sql語句轉(zhuǎn)換成mapreduce去處理。

2.hive的架構(gòu)

(1)用戶的接口:寫sql的地方绢记,shell/cli jdbc odbc web接口
(2)解析器:

  • 1)編譯器:需要將sql編譯成mapreduce
  • 2)優(yōu)化器:寫一個sql扁达,對sql進行一個優(yōu)化
  • 3)執(zhí)行器:將mr交由yarn去執(zhí)行

2.hive的架構(gòu):
? 1)用戶接口:Hive提供多種用戶接口,主要通過shell的client完成相關(guān)操作
? 2)解析器:
? 1)編譯器:用于sql的解析蠢熄,轉(zhuǎn)化為mapreduce
? 2)優(yōu)化器:在編譯后的結(jié)果進行優(yōu)化跪解。
? 3)執(zhí)行器:執(zhí)行sql(最終執(zhí)行mapreduce)


image.png

? 1)用戶接口:Hive提供多種用戶接口,主要通過shell的client完成相關(guān)操作
? 2)解析器:
? 1)編譯器:用于sql的解析签孔,轉(zhuǎn)化為mapreduce
? 2)優(yōu)化器:在編譯后的結(jié)果進行優(yōu)化叉讥。
? 3)執(zhí)行器:執(zhí)行sql(最終執(zhí)行mapreduce)


image.png

MetaStore : 提供元數(shù)據(jù)服務(wù)。
Driver : 管理HQL執(zhí)行的生命周期饥追,貫穿Hive任務(wù)整個執(zhí)行期間图仓。
Compiler : 編譯HQL并將其轉(zhuǎn)化為一系列的Map/Reduce任務(wù)。
Optimizer : 優(yōu)化器但绕,優(yōu)化HQL生成的執(zhí)行計劃和MapReduce任務(wù)救崔。
Executor : 執(zhí)行Map/Reduce任務(wù)。
ThriftServer : 提供thrift接口捏顺,作為JDBC和ODBC的服務(wù)端六孵,將Hive和其他應(yīng)用程序集成起來。
Clients :為用戶訪問提供命令行接口Beeline和JDBC/ODBC接口幅骄。
image.png

(3)元數(shù)據(jù):默認存儲derby數(shù)據(jù)庫

    1. /hive bin/hive 產(chǎn)生兩個庫劫窒,元數(shù)據(jù)導(dǎo)致不一致
  • 2.只允許一個人連接
  • 3.實際中,我們使用mysql數(shù)據(jù)進行元數(shù)據(jù)的存儲和管理
3.hive的安裝部署

在使用hive之前拆座,一定要啟動hadoop
(1)詳見文檔
(2)hive使用beeline的方式:
? 使用beeline連接主巍,hive中沒有設(shè)置對于自己的用戶名和密碼冠息,輸入用戶名和密碼,對于用戶名要使用hadoop安裝時的用戶名煤禽,輸入root

hive的使用方式:
有3種
元數(shù)據(jù)存放在mysql
? 1)hive shell
? 2)通過jdbc的方式連接铐达,beeline
===[首先啟動metastore岖赋,再啟動hiveserver2]
? 首先要啟動服務(wù)檬果,hiveserver2
? 前臺啟動方式: bin/hive --service hiveserver2
? 后臺啟動方式:nohup bin/hive --service hiveserver2 2>&1 &
? 然后通過beeline的方式訪問:
? bin/beeline
? !connect jdbc:hive2://node03:10000
3)hive 命令
? hive -e #指定一個sql語句執(zhí)行
? bin/hive -e "use test;select * from test001;“
? hive -f #指定一個sql腳本執(zhí)行
? bin/hive -f text.sql


2.hive的介紹
? hive:是基于hadoop的數(shù)據(jù)倉庫的工具。hive中數(shù)據(jù)的存儲在hadoop的hdfs上進行存儲唐断。
? hive中數(shù)據(jù)的分析选脊,使用類sql的語言進行分析---HQL
? hive中sql的自行,最終會轉(zhuǎn)換成mapreduce去執(zhí)行脸甘。
學(xué)習(xí)hive的原因:
? 1)學(xué)習(xí)成本的降低
? 2) 降低項目開發(fā)周期
? 3)mapreduce的難度大
? 使用hive:
? 1)操作簡單易上手
hive的特點:
? 1)可擴展:hive可以自由擴展集群的規(guī)模恳啥。
? 注意:hive沒有集群的概念,只是一個工具丹诀。
? 2)延展性:功能可以擴展钝的,主要是用戶自定義函數(shù)(udf)
? 3)容錯:hadoop的容錯機制。

? hive和hadoop的關(guān)系:

? hive中數(shù)據(jù)存儲是基于hdfs
? hive的HQL執(zhí)行是基于mapreduce
? hive和hadoop的關(guān)系:緊耦合

hive:數(shù)據(jù)倉庫铆遭,基于hadoop實現(xiàn)
架構(gòu):hadoop,
執(zhí)行引擎:mr
存儲:hdfs
安裝:默認使用derby硝桩,我們要使用mysql

客戶端的連接:
1 bin/hive
2 beeline
3bin/hive 
-e 執(zhí)行sql
-f執(zhí)行sql文件

Hive和數(shù)據(jù)庫比較
Hive 和數(shù)據(jù)庫除了擁有類似的查詢語言,再無類似之處枚荣。
1)數(shù)據(jù)存儲位置
1碗脊、Hive 存儲在 HDFS 。
2橄妆、數(shù)據(jù)庫將數(shù)據(jù)保存在塊設(shè)備或者本地文件系統(tǒng)中衙伶。
2)數(shù)據(jù)更新
Hive中不建議對數(shù)據(jù)的改寫。
而數(shù)據(jù)庫中的數(shù)據(jù)通常是需要經(jīng)常進行修改的害碾。
3)執(zhí)行延遲
Hive 執(zhí)行延遲較高矢劲。數(shù)據(jù)庫的執(zhí)行延遲較低。當(dāng)然慌随,這個是有條件的芬沉,即數(shù)據(jù)規(guī)模較小,當(dāng)數(shù)據(jù)規(guī)模大到超過數(shù)據(jù)庫的處理能力的時候儒陨,Hive的并行計算顯然能體現(xiàn)出優(yōu)勢花嘶。
4)數(shù)據(jù)規(guī)模
Hive支持很大規(guī)模的數(shù)據(jù)計算;數(shù)據(jù)庫可以支持的數(shù)據(jù)規(guī)模較小蹦漠。

Hive架構(gòu)

image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末椭员,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子笛园,更是在濱河造成了極大的恐慌隘击,老刑警劉巖侍芝,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異埋同,居然都是意外死亡州叠,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門凶赁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來咧栗,“玉大人,你說我怎么就攤上這事虱肄≈掳澹” “怎么了?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵咏窿,是天一觀的道長斟或。 經(jīng)常有香客問我,道長集嵌,這世上最難降的妖魔是什么萝挤? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮根欧,結(jié)果婚禮上怜珍,老公的妹妹穿的比我還像新娘。我一直安慰自己咽块,他們只是感情好绘面,可當(dāng)我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著侈沪,像睡著了一般揭璃。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上亭罪,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天瘦馍,我揣著相機與錄音,去河邊找鬼应役。 笑死情组,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的箩祥。 我是一名探鬼主播院崇,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼袍祖!你這毒婦竟也來了底瓣?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤蕉陋,失蹤者是張志新(化名)和其女友劉穎捐凭,沒想到半個月后拨扶,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡茁肠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年患民,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片垦梆。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡匹颤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出奶赔,到底是詐尸還是另有隱情惋嚎,我是刑警寧澤,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布站刑,位于F島的核電站,受9級特大地震影響鼻百,放射性物質(zhì)發(fā)生泄漏绞旅。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一温艇、第九天 我趴在偏房一處隱蔽的房頂上張望因悲。 院中可真熱鬧,春花似錦勺爱、人聲如沸晃琳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽卫旱。三九已至,卻和暖如春围段,著一層夾襖步出監(jiān)牢的瞬間顾翼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工奈泪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留适贸,地道東北人。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓涝桅,卻偏偏與公主長得像拜姿,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子冯遂,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,685評論 2 360