HIVE總結(jié)(待更新)

[TOC]

組件

metastore
gateway
hiveserver2

1 在HDFS中創(chuàng)建/tmp和/user/hive/warehouse并設(shè)置權(quán)限

hadoop fs -mkdir /tmp
hadoop fs -mkdir -p /user/hive/warehouse
hadoop fs -chmod g+w /tmp
hadoop fs -chmod g+w /user/hive/warehouse

2 下載mysql-connector-java-5.1.27-bin.jar文件台腥,并放到$HIVE_HOME/lib目錄下

下載mysql-connector-java-5.1.27-bin.jar文件态贤,并放到$HIVE_HOME/lib目錄下

https://mvnrepository.com/artifact/mysql/mysql-connector-java/5.1.27

3 需要創(chuàng)建在mysql 中 hive 的數(shù)據(jù)庫 (注意docker 中的mysql容器啟動)

  • MariaDB數(shù)據(jù)庫管理系統(tǒng)是MySQL的一個分支,啟動我本地的maria

[圖片上傳失敗...(image-c078bb-1571909665062)]

4 初始化meta數(shù)據(jù)庫

schematool -initSchema -dbType mysql

5 測試hive shell

hive
show databases;
show tables;
  • 紅框是沒啟動數(shù)據(jù)庫的
  • 綠框是啟動后的
img

6 將本地文件考入 hdfs 文件系統(tǒng)中

hdfs dfs -put <local> <hdfs>

7 hive創(chuàng)建新表

hive> CREATE TABLE t_hive (a int, b int, c int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
OK
Time taken: 0.121 seconds

8 導(dǎo)入數(shù)據(jù)t_hive.txt到t_hive表(/hdfs導(dǎo)入)

hive> LOAD DATA LOCAL INPATH '/tmp/t_hive.txt' OVERWRITE INTO TABLE t_hive ;
Loading data to table default.t_hive
OK
Time taken: 0.609 seconds

9 查看表

hive> show tables;
OK
t_hive
Time taken: 0.099 seconds

10 正則匹配表名

hive>show tables '*t*';
OK
t_hive
Time taken: 0.065 seconds

11 查看表結(jié)構(gòu)

hive> desc t_hive;
OK
a       int
b       int
c       int
Time taken: 0.1 seconds

12在hive中查看目錄結(jié)構(gòu)


hive> dfs -lsr /;

創(chuàng)建test表

create table test(
id int, name string
,tel string)
partitioned by
(age int)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;

下面語句就是將wyp表中的查詢結(jié)果并插入到test表中:

hive> insert into table test
partition (age='25')
select id, name, tel
from wyp;

查看表

hive> select * from test;

讓hive 事務(wù)支持ACID

---修改hive-site.xml-使他支持ACID--
<property> 
<name>hive.support.concurrency</name> 
<value>true</value> 
</property> 
<property> 
<name>hive.exec.dynamic.partition.mode</name> 
<value>nonstrict</value> 
</property> 
<property> 
<name>hive.txn.manager</name> 
<value>org.apache.hadoop.hive.ql.lockmgr.DbTxnManager</value> 
</property> 
<property> 
<name>hive.compactor.initiator.on</name> 
<value>true</value> 
</property> 
<property> 
<name>hive.compactor.worker.threads</name> 
<value>2</value> 
</property> 

hive 動態(tài)分區(qū) && 靜態(tài)分區(qū)

跟靜態(tài)分區(qū)對比的好處是 sql 語句沒有那么多。

  • 靜態(tài)分區(qū)& 查詢

    - 創(chuàng)建
    create table ptest (userid int) partitioned by (date string) row format delimited fields terminated by '\t';
    - 導(dǎo)入
    load data local inpath '/' into table ptest partion (date="2019-07-11");
    

hive 分區(qū)表和分桶表

分桶是相對分區(qū)進(jìn)行更細(xì)粒度的劃分。分桶將整個數(shù)據(jù)內(nèi)容安裝某列屬性值得hash值進(jìn)行區(qū)分,如要安裝name屬性分為3個桶,就是對name屬性值的hash值對3取摸

Hive學(xué)習(xí)之抽樣(tablesample)

當(dāng)數(shù)據(jù)量特別大時坯汤,對全體數(shù)據(jù)進(jìn)行處理存在困難時,抽樣就顯得尤其重要了搀愧。抽樣可以從被抽取的數(shù)據(jù)中估計和推斷出整體的特性惰聂,是科學(xué)實驗疆偿、質(zhì)量檢驗、社會調(diào)查普遍采用的一種經(jīng)濟(jì)有效的工作和研究方法搓幌。

Hive支持桶表抽樣和塊抽樣杆故,下面分別學(xué)習(xí)。所謂桶表指的是在創(chuàng)建表時使用CLUSTERED BY子句創(chuàng)建了桶的表溉愁。桶表抽樣的語法如下:

table_sample: TABLESAMPLE (BUCKET x OUT OF y [ON colname]) 

hive 引擎

hive.execution.engine=spark
hive.execution.engine=mr

37開 - 原創(chuàng)文章(已經(jīng)在多平臺發(fā)表)处铛,轉(zhuǎn)載請標(biāo)明出處

原文地址-99get81.com

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市拐揭,隨后出現(xiàn)的幾起案子撤蟆,更是在濱河造成了極大的恐慌,老刑警劉巖投队,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件枫疆,死亡現(xiàn)場離奇詭異,居然都是意外死亡敷鸦,警方通過查閱死者的電腦和手機(jī)息楔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來扒披,“玉大人值依,你說我怎么就攤上這事〉福” “怎么了愿险?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長价说。 經(jīng)常有香客問我辆亏,道長,這世上最難降的妖魔是什么鳖目? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任扮叨,我火速辦了婚禮,結(jié)果婚禮上领迈,老公的妹妹穿的比我還像新娘彻磁。我一直安慰自己,他們只是感情好狸捅,可當(dāng)我...
    茶點故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布衷蜓。 她就那樣靜靜地躺著,像睡著了一般尘喝。 火紅的嫁衣襯著肌膚如雪磁浇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天朽褪,我揣著相機(jī)與錄音扯夭,去河邊找鬼鳍贾。 笑死,一個胖子當(dāng)著我的面吹牛交洗,可吹牛的內(nèi)容都是我干的骑科。 我是一名探鬼主播,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼构拳,長吁一口氣:“原來是場噩夢啊……” “哼咆爽!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起置森,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤斗埂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后凫海,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體呛凶,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年行贪,在試婚紗的時候發(fā)現(xiàn)自己被綠了漾稀。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,789評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡建瘫,死狀恐怖崭捍,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情啰脚,我是刑警寧澤殷蛇,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站橄浓,受9級特大地震影響粒梦,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜荸实,卻給世界環(huán)境...
    茶點故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一匀们、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧泪勒,春花似錦、人聲如沸宴猾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽仇哆。三九已至沦辙,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間讹剔,已是汗流浹背油讯。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工详民, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人陌兑。 一個月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓沈跨,卻偏偏與公主長得像,于是被迫代替她去往敵國和親兔综。 傳聞我的和親對象是個殘疾皇子饿凛,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,697評論 2 351

推薦閱讀更多精彩內(nèi)容

  • Zookeeper用于集群主備切換。 YARN讓集群具備更好的擴(kuò)展性软驰。 Spark沒有存儲能力涧窒。 Spark的Ma...
    Yobhel閱讀 7,258評論 0 34
  • hive.ddl.output.format:hive的ddl語句的輸出格式,默認(rèn)是text锭亏,純文本纠吴,還有json...
    博弈史密斯閱讀 1,943評論 0 6
  • 使用Hadoop和Hive。 首先慧瘤,Hive是使用了MapReduce引擎和HDFS存儲的中間鍵戴已,其元數(shù)據(jù)存儲在M...
    zealscott閱讀 2,737評論 0 0
  • #約后個人輸出#山下英子通過人與物體的關(guān)系,再上升到人與心靈的關(guān)系碑隆,寫出了斷舍離恭陡,“斷",斷去不需要的東西的...
    洪少閱讀 284評論 0 1
  • 有時候我在想,這個世界是不是病態(tài)了上煤? 看個小感冒不找關(guān)系休玩,很容易就是一堆藥一堆針劑等待著你。 辦理準(zhǔn)生證不找關(guān)系劫狠,...
    精靈長大要變美閱讀 106評論 0 0