Hive基礎之表操作

使用過Oracle數據庫的童鞋都知道Oracle里面有兩張經典的表員工(emp)和部門(dept),本文就以這兩張表為基礎参滴，介紹一些Hive中表的一些基表操作有巧。

1.創(chuàng)建表

根據emp和dept的字段類型，將其轉換為Hive中的對應的數據類型牺弹，我們可以得到這兩張表的建表語句：

--員工表

create table IF NOT EXISTS default.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

--部門表

create table IF NOT EXISTS default.dept(
deptno int,
dname string,
loc string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

在hive控制臺界面執(zhí)行上面的建表命令，然后檢查兩張表是否創(chuàng)建成功：

hive (default)> show tables;
OK
tab_name
dept
emp
Time taken: 0.079 seconds, Fetched: 2 row(s)

可以看到dept和emp兩張表都已經創(chuàng)建成功了捎谨。

2.加載數據

將Oracle中這兩張表的數據導出成文本格式emp.txt和dept.txt诫尽，導出時以制表符(\t)對字段進行分割,然后將這兩個文件上傳到hive客戶端的服務器上禀酱，接下來就可以對數據進行加載了。

hive (default)> load data local inpath '/opt/datas/emp.txt' overwrite into table emp ;
Loading data to table default.emp
Table default.emp stats: [numFiles=1, totalSize=659]
OK
Time taken: 0.843 seconds
hive (default)> load data local inpath '/opt/datas/dept.txt' overwrite into table dept ;
Loading data to table default.dept
Table default.dept stats: [numFiles=1, totalSize=82]
OK
Time taken: 0.417 seconds

然后查看加載的數據是否正確：

hive (default)> select * from emp;
OK
empno   ename   job     mgr     hiredate        sal     comm    deptno
7369    SMITH   CLERK   7902    1980-12-17      800.0   NULL    20
7499    ALLEN   SALESMAN        7698    1981-2-20       1600.0  300.0   30
7521    WARD    SALESMAN        7698    1981-2-22       1250.0  500.0   30
7566    JONES   MANAGER 7839    1981-4-2        2975.0  NULL    20
7654    MARTIN  SALESMAN        7698    1981-9-28       1250.0  1400.0  30
7698    BLAKE   MANAGER 7839    1981-5-1        2850.0  NULL    30
7782    CLARK   MANAGER 7839    1981-6-9        2450.0  NULL    10
7788    SCOTT   ANALYST 7566    1987-4-19       3000.0  NULL    20
7839    KING    PRESIDENT       NULL    1981-11-17      5000.0  NULL    10
7844    TURNER  SALESMAN        7698    1981-9-8        1500.0  0.0     30
7876    ADAMS   CLERK   7788    1987-5-23       1100.0  NULL    20
7900    JAMES   CLERK   7698    1981-12-3       950.0   NULL    30
7902    FORD    ANALYST 7566    1981-12-3       3000.0  NULL    20
7934    MILLER  CLERK   7782    1982-1-23       1300.0  NULL    10
Time taken: 0.272 seconds, Fetched: 14 row(s)
hive (default)> select * from dept;
OK
deptno  dname   loc
10      ACCOUNTING      NEW YORK
20      RESEARCH        DALLAS
30      SALES   CHICAGO
40      OPERATIONS      BOSTON
Time taken: 0.14 seconds, Fetched: 4 row(s)

可以到數據已經正確加載進來了牧嫉。

3.創(chuàng)建子表

創(chuàng)建子表的語句如下：

create table if not exists default.dept_cats
as
select deptno, dname from dept ;

在hive中執(zhí)行的結果如下：

hive (default)> create table if not exists default.dept_cats
              > as
              > select deptno, dname from dept ;
Query ID = hive_20190213212727_c554cafb-6c5d-4e0c-8ad6-a19f902f3222
Total jobs = 3
Launching Job 1 out of 3
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_1550060164760_0002, Tracking URL = http://node1:8088/proxy/application_1550060164760_0002/
Kill Command = /opt/cloudera/parcels/CDH-5.15.2-1.cdh5.15.2.p0.3/lib/hadoop/bin/hadoop job  -kill job_1550060164760_0002
Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0
2019-02-13 21:28:39,419 Stage-1 map = 0%,  reduce = 0%
2019-02-13 21:29:14,401 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 1.64 sec
MapReduce Total cumulative CPU time: 1 seconds 640 msec
Ended Job = job_1550060164760_0002
Stage-4 is selected by condition resolver.
Stage-3 is filtered out by condition resolver.
Stage-5 is filtered out by condition resolver.
Moving data to: hdfs://node1:8020/user/hive/warehouse/.hive-staging_hive_2019-02-13_21-27-40_322_2052979003044233314-1/-ext-10001
Moving data to: hdfs://node1:8020/user/hive/warehouse/dept_cats
Table default.dept_cats stats: [numFiles=1, numRows=4, totalSize=49, rawDataSize=45]
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 1   Cumulative CPU: 1.64 sec   HDFS Read: 3352 HDFS Write: 122 SUCCESS
Total MapReduce CPU Time Spent: 1 seconds 640 msec
OK
deptno  dname
Time taken: 96.555 seconds

可以看出剂跟，在創(chuàng)建子表的時候會在Yarn平臺上運行MapReduce，運行完之后我們查看一下結果：

hive (default)> show tables;
OK
tab_name
dept
dept_cats
emp
Time taken: 0.017 seconds, Fetched: 3 row(s)
hive (default)> select * from dept_cats;
OK
deptno  dname
10      ACCOUNTING
20      RESEARCH
30      SALES
40      OPERATIONS
Time taken: 0.121 seconds, Fetched: 4 row(s)

新增的表dept_cats有4條記錄酣藻，說明我們已經成果的創(chuàng)建了子表曹洽。

4.清除表數據

清除一張表中的數據使用truncate命令，我們把表dept_cats中的數據進行清除：

hive (default)> truncate table dept_cats;
OK
Time taken: 0.29 seconds
hive (default)> select * from dept_cats;
OK
deptno  dname
Time taken: 0.121 seconds

可以看出剛才創(chuàng)建的子表的數據已經被清除了辽剧。

5.修改表名稱

首先我們用like的方式創(chuàng)建一張表：

hive (default)> create table if not exists default.dept_like
              > like
              > default.dept ;
OK
Time taken: 0.188 seconds
hive (default)> show tables;
OK
tab_name
dept
dept_cats
dept_like
emp
Time taken: 0.065 seconds, Fetched: 4 row(s)

然后對新建的表dept_like修改名稱：

hive (default)> alter table dept_like rename to dept_like_rn ;
OK
Time taken: 0.501 seconds
hive (default)> show tables;
OK
tab_name
dept
dept_cats
dept_like_rn
emp
Time taken: 0.052 seconds, Fetched: 4 row(s)

可以看到表dept_like已經被修改為dept_like_rn送淆。注意，在hive中一般不去修改字段的名稱或者增加字段抖仅，hive主要是用來進行數據分析的，所以如果要修改字段名稱可以使用創(chuàng)建子表的方式來進行砖第。

6.刪除表

刪除一張表用drop命令撤卢，我們刪除剛才新建的表：

hive (default)> drop table if exists dept_like_rn ;
OK
Time taken: 0.542 seconds
hive (default)> show tables;
OK
tab_name
dept
dept_cats
emp
Time taken: 0.049 seconds, Fetched: 3 row(s)

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市梧兼，隨后出現的幾起案子放吩，更是在濱河造成了極大的恐慌，老刑警劉巖羽杰，帶你破解...
沈念sama閱讀 218,525評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件渡紫，死亡現場離奇詭異，居然都是意外死亡考赛，警方通過查閱死者的電腦和手機惕澎，發(fā)現死者居然都...
沈念sama閱讀 93,203評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來颜骤，“玉大人唧喉，你說我怎么就攤上這事∪坛椋” “怎么了八孝？”我有些...
開封第一講書人閱讀 164,862評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長鸠项。經常有香客問我干跛，道長，這世上最難降的妖魔是什么祟绊？我笑而不...
開封第一講書人閱讀 58,728評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任楼入，我火速辦了婚禮哥捕，結果婚禮上，老公的妹妹穿的比我還像新娘浅辙。我一直安慰自己扭弧，他們只是感情好，可當我...
茶點故事閱讀 67,743評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布记舆。她就那樣靜靜地躺著鸽捻，像睡著了一般。火紅的嫁衣襯著肌膚如雪泽腮。梳的紋絲不亂的頭發(fā)上御蒲，一...
開封第一講書人閱讀 51,590評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音诊赊，去河邊找鬼厚满。笑死，一個胖子當著我的面吹牛碧磅，可吹牛的內容都是我干的碘箍。我是一名探鬼主播，決...
沈念sama閱讀 40,330評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼鲸郊，長吁一口氣：“原來是場噩夢啊……” “哼丰榴！你這毒婦竟也來了？” 一聲冷哼從身側響起秆撮，我...
開封第一講書人閱讀 39,244評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤四濒，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后职辨，有當地人在樹林里發(fā)現了一具尸體盗蟆，經...
沈念sama閱讀 45,693評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,885評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年舒裤，在試婚紗的時候發(fā)現自己被綠了喳资。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,001評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡腾供，死狀恐怖骨饿，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情台腥，我是刑警寧澤宏赘，帶...
沈念sama閱讀 35,723評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站黎侈，受9級特大地震影響察署，放射性物質發(fā)生泄漏。R本人自食惡果不足惜峻汉，卻給世界環(huán)境...
茶點故事閱讀 41,343評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一贴汪、第九天我趴在偏房一處隱蔽的房頂上張望脐往。院中可真熱鬧，春花似錦扳埂、人聲如沸业簿。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,919評論 0贊 22
一樁弒父案阳懂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽梅尤。三九已至，卻和暖如春岩调，著一層夾襖步出監(jiān)牢的瞬間巷燥，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,042評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工号枕，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留缰揪，地道東北人。一個月前我還...
沈念sama閱讀 48,191評論 3贊 370
代替公主和親
正文我出身青樓葱淳，卻偏偏與公主長得像钝腺，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子赞厕，可洞房花燭夜當晚...
茶點故事閱讀 44,955評論 2贊 355