Hive高級(jí)查詢操作

根據(jù)已經(jīng)存在的表瘾晃，使用as關(guān)鍵字，創(chuàng)建一個(gè)與查詢結(jié)果字段一致的表呵晚，同時(shí)將查詢結(jié)果數(shù)據(jù)插入到新表

只有student_id,name兩個(gè)字段的表

刪除列,將繼續(xù)存在的列再定義一遍兆旬，需要?jiǎng)h除的列不再定義

字段名稱類型注釋分桶字段

student_idstring學(xué)生ID是

namestring姓名否

ageint年齡否

originstring學(xué)院ID否

查看hdfs分桶文件

說(shuō)明：

分桶表一般不使用load向分桶表中導(dǎo)入數(shù)據(jù)，因?yàn)閘oad導(dǎo)入數(shù)據(jù)只是將數(shù)據(jù)復(fù)制到表的數(shù)據(jù)存儲(chǔ)目錄下朵栖，hive并不會(huì)在load的時(shí)候?qū)?shù)據(jù)進(jìn)行分析然后按照分桶字段分桶，load只會(huì)將一個(gè)文件全部導(dǎo)入到分桶表中柴梆，并沒(méi)有分桶陨溅。一般采用insert從其他表向分桶表插入數(shù)據(jù)。分桶表在創(chuàng)建表的時(shí)候只是定義表的模型轩性，插入的時(shí)候需要做如下操作：在每次執(zhí)行分桶插入的時(shí)候在當(dāng)前執(zhí)行的session會(huì)話中要設(shè)置

聲明本次執(zhí)行的是一次分桶操作声登。需要指定reduce個(gè)數(shù)與分桶的數(shù)量相同

這樣才能保證有多少桶就生成多少個(gè)文件狠鸳。如果定義了按照分桶字段排序揣苏，需要在從其他表查詢數(shù)據(jù)過(guò)程中將數(shù)據(jù)按照分區(qū)字段排序之后插入各個(gè)桶中，分桶表并不會(huì)將各分桶中的數(shù)據(jù)排序件舵。排序和分桶的字段相同的時(shí)候使用Cluster by(字段),cluster by 默認(rèn)按照分桶字段在桶內(nèi)升序排列卸察，如果需要在桶內(nèi)降序排列，使用distribute by (col) sort by (col desc)組合實(shí)現(xiàn)铅祸。

導(dǎo)出數(shù)據(jù)到本地的常用方法

默認(rèn)結(jié)果分隔符：' '

創(chuàng)建2張表

導(dǎo)入數(shù)據(jù)

等同于

兩個(gè)表通過(guò)id關(guān)聯(lián)坑质，把兩個(gè)表的數(shù)據(jù)全部查詢出來(lái)

左連接時(shí)，左表中出現(xiàn)的join字段都保留临梗，右表沒(méi)有連接上的都為空

右連接時(shí)涡扼，右表中出現(xiàn)的join字段都保留，左表沒(méi)有連接上的都是空

左半連接實(shí)現(xiàn)了類似IN/EXISTS的查詢語(yǔ)義盟庞，輸出符合條件的左表內(nèi)容吃沪。 hive不支持in …exists這種關(guān)系型數(shù)據(jù)庫(kù)中的子查詢結(jié)構(gòu)，hive暫時(shí)不支持右半連接什猖。例如：

使用Hive對(duì)應(yīng)于如下語(yǔ)句：

使用分布式緩存將小表數(shù)據(jù)加載都各個(gè)map任務(wù)中票彪，在map端完成join，map任務(wù)輸出后不狮，不需要將數(shù)據(jù)拷貝到reducer階段再進(jìn)行join降铸，降低的數(shù)據(jù)在網(wǎng)絡(luò)節(jié)點(diǎn)之間傳輸?shù)拈_(kāi)銷。多表關(guān)聯(lián)數(shù)據(jù)傾斜優(yōu)化的一種手段摇零。多表連接推掸，如果只有一個(gè)表比較大，其他表都很小，則join操作會(huì)轉(zhuǎn)換成一個(gè)只包含map的Job谅畅。運(yùn)行日志中會(huì)出現(xiàn)Number of reduce tasks is set to 0 since there's no reduce operator 沒(méi)有reduce的提示俊嗽。例如：

創(chuàng)建用戶評(píng)分表

導(dǎo)入數(shù)據(jù)

語(yǔ)法2：CASE WHEN a THEN b [WHEN c THEN d]* [ELSE e] END 說(shuō)明：如果a為TRUE，則返回b；如果c為TRUE趁耗，則返回d掌眠；否則返回e 例如：

查詢用戶評(píng)分表，每個(gè)年齡段的最大評(píng)分值

結(jié)果為：

當(dāng)Hive提供的內(nèi)置函數(shù)無(wú)法滿足你的業(yè)務(wù)處理需要時(shí)竹揍，此時(shí)就可以考慮使用用戶自定義函數(shù)（UDF：user-defined function）。 UDF 作用于單個(gè)數(shù)據(jù)行邪铲，產(chǎn)生一個(gè)數(shù)據(jù)行作為輸出芬位。步驟：

新建類繼承UDF

將項(xiàng)目進(jìn)行打包

說(shuō)明:

如出現(xiàn)以下異常信息： Failed to execute goal on project hive-exec: Could not resolve dependencies for project org.apache.hive:hive-exec:jar:2.3.0: Could not find artifact org.pentaho:pentaho-aggdesigner-algorithm:jar:5.1.5-jhyde in alimaven (http://maven.aliyun.com/nexus/content/groups/public/) -> [Help 1]

請(qǐng)手動(dòng)下載Jar包pentaho-aggdesigner-algorithm/5.1.5-jhyde.jar 下載地址：

將Jar包放置在本地Maven倉(cāng)庫(kù)org/pentaho/pentaho-aggdesigner-algorithm/5.1.5-jhyde路徑下，之后進(jìn)行重新打包带到。

創(chuàng)建臨時(shí)函數(shù)與開(kāi)發(fā)好的java class關(guān)聯(lián)

在hql中使用自定義的函數(shù)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末昧碉，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子揽惹，更是在濱河造成了極大的恐慌被饿，老刑警劉巖，帶你破解...
沈念sama閱讀 219,188評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件搪搏，死亡現(xiàn)場(chǎng)離奇詭異狭握，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)疯溺，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,464評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門论颅，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人囱嫩，你說(shuō)我怎么就攤上這事恃疯。” “怎么了墨闲？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,562評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵今妄，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我损俭，道長(zhǎng)蛙奖，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,893評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任杆兵，我火速辦了婚禮雁仲，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘琐脏。我一直安慰自己攒砖，他們只是感情好缸兔，可當(dāng)我...
茶點(diǎn)故事閱讀 67,917評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著吹艇，像睡著了一般惰蜜。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上受神，一...
開(kāi)封第一講書(shū)人閱讀 51,708評(píng)論 1贊 305
城市分裂傳說(shuō)
那天抛猖，我揣著相機(jī)與錄音，去河邊找鬼鼻听。笑死财著，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的撑碴。我是一名探鬼主播撑教，決...
沈念sama閱讀 40,430評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼醉拓！你這毒婦竟也來(lái)了伟姐？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 39,342評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤亿卤，失蹤者是張志新（化名）和其女友劉穎愤兵，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體怠噪，經(jīng)...
沈念sama閱讀 45,801評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡恐似，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,976評(píng)論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年杜跷，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了傍念。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,115評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡葛闷，死狀恐怖憋槐，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情淑趾，我是刑警寧澤阳仔，帶...
沈念sama閱讀 35,804評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站扣泊，受9級(jí)特大地震影響近范，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜延蟹，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,458評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一评矩、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧阱飘，春花似錦斥杜、人聲如沸虱颗。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,008評(píng)論 0贊 22
一樁弒父案蔗喂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)忘渔。三九已至，卻和暖如春缰儿，著一層夾襖步出監(jiān)牢的瞬間畦粮，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,135評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工乖阵，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留锈玉，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,365評(píng)論 3贊 373
代替公主和親
正文我出身青樓义起，卻偏偏與公主長(zhǎng)得像拉背，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子默终，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,055評(píng)論 2贊 355

Hive高級(jí)查詢操作

推薦閱讀更多精彩內(nèi)容