Hive高級(jí)查詢操作

根據(jù)已經(jīng)存在的表瘾晃,使用as關(guān)鍵字,創(chuàng)建一個(gè)與查詢結(jié)果字段一致的表呵晚,同時(shí)將查詢結(jié)果數(shù)據(jù)插入到新表

只有student_id,name兩個(gè)字段的表

刪除列,將繼續(xù)存在的列再定義一遍兆旬,需要?jiǎng)h除的列不再定義

字段名稱類型注釋分桶字段

student_idstring學(xué)生ID是

namestring姓名否

ageint年齡否

originstring學(xué)院ID否

查看hdfs分桶文件

說(shuō)明:

分桶表一般不使用load向分桶表中導(dǎo)入數(shù)據(jù),因?yàn)閘oad導(dǎo)入數(shù)據(jù)只是將數(shù)據(jù)復(fù)制到表的數(shù)據(jù)存儲(chǔ)目錄下朵栖,hive并不會(huì)在load的時(shí)候?qū)?shù)據(jù)進(jìn)行分析然后按照分桶字段分桶,load只會(huì)將一個(gè)文件全部導(dǎo)入到分桶表中柴梆,并沒(méi)有分桶陨溅。一般采用insert從其他表向分桶表插入數(shù)據(jù)。 分桶表在創(chuàng)建表的時(shí)候只是定義表的模型轩性,插入的時(shí)候需要做如下操作: 在每次執(zhí)行分桶插入的時(shí)候在當(dāng)前執(zhí)行的session會(huì)話中要設(shè)置

聲明本次執(zhí)行的是一次分桶操作声登。需要指定reduce個(gè)數(shù)與分桶的數(shù)量相同

這樣才能保證有多少桶就生成多少個(gè)文件狠鸳。 如果定義了按照分桶字段排序揣苏,需要在從其他表查詢數(shù)據(jù)過(guò)程中將數(shù)據(jù)按照分區(qū)字段排序之后插入各個(gè)桶中,分桶表并不會(huì)將各分桶中的數(shù)據(jù)排序件舵。排序和分桶的字段相同的時(shí)候使用Cluster by(字段),cluster by 默認(rèn)按照分桶字段在桶內(nèi)升序排列卸察,如果需要在桶內(nèi)降序排列,使用distribute by (col) sort by (col desc)組合實(shí)現(xiàn)铅祸。

導(dǎo)出數(shù)據(jù)到本地的常用方法

默認(rèn)結(jié)果分隔符:' '

創(chuàng)建2張表

導(dǎo)入數(shù)據(jù)

等同于

兩個(gè)表通過(guò)id關(guān)聯(lián)坑质,把兩個(gè)表的數(shù)據(jù)全部查詢出來(lái)

左連接時(shí),左表中出現(xiàn)的join字段都保留临梗,右表沒(méi)有連接上的都為空

右連接時(shí)涡扼,右表中出現(xiàn)的join字段都保留,左表沒(méi)有連接上的都是空

左半連接實(shí)現(xiàn)了類似IN/EXISTS的查詢語(yǔ)義盟庞,輸出符合條件的左表內(nèi)容吃沪。 hive不支持in …exists這種關(guān)系型數(shù)據(jù)庫(kù)中的子查詢結(jié)構(gòu),hive暫時(shí)不支持右半連接什猖。 例如:

使用Hive對(duì)應(yīng)于如下語(yǔ)句:

使用分布式緩存將小表數(shù)據(jù)加載都各個(gè)map任務(wù)中票彪,在map端完成join,map任務(wù)輸出后不狮,不需要將數(shù)據(jù)拷貝到reducer階段再進(jìn)行join降铸, 降低的數(shù)據(jù)在網(wǎng)絡(luò)節(jié)點(diǎn)之間傳輸?shù)拈_(kāi)銷。多表關(guān)聯(lián)數(shù)據(jù)傾斜優(yōu)化的一種手段摇零。多表連接推掸,如果只有一個(gè)表比較大,其他表都很小, 則join操作會(huì)轉(zhuǎn)換成一個(gè)只包含map的Job谅畅。運(yùn)行日志中會(huì)出現(xiàn)Number of reduce tasks is set to 0 since there's no reduce operator 沒(méi)有reduce的提示俊嗽。 例如:

創(chuàng)建用戶評(píng)分表

導(dǎo)入數(shù)據(jù)

語(yǔ)法2:CASE WHEN a THEN b [WHEN c THEN d]* [ELSE e] END 說(shuō)明:如果a為TRUE,則返回b;如果c為TRUE趁耗,則返回d掌眠;否則返回e 例如:

查詢用戶評(píng)分表,每個(gè)年齡段的最大評(píng)分值

結(jié)果為:

當(dāng)Hive提供的內(nèi)置函數(shù)無(wú)法滿足你的業(yè)務(wù)處理需要時(shí)竹揍,此時(shí)就可以考慮使用用戶自定義函數(shù)(UDF:user-defined function)。 UDF 作用于單個(gè)數(shù)據(jù)行邪铲,產(chǎn)生一個(gè)數(shù)據(jù)行作為輸出芬位。 步驟:

新建類繼承UDF

將項(xiàng)目進(jìn)行打包

說(shuō)明:

如出現(xiàn)以下異常信息: Failed to execute goal on project hive-exec: Could not resolve dependencies for project org.apache.hive:hive-exec:jar:2.3.0: Could not find artifact org.pentaho:pentaho-aggdesigner-algorithm:jar:5.1.5-jhyde in alimaven (http://maven.aliyun.com/nexus/content/groups/public/) -> [Help 1]

請(qǐng)手動(dòng)下載Jar包pentaho-aggdesigner-algorithm/5.1.5-jhyde.jar 下載地址:

將Jar包放置在本地Maven倉(cāng)庫(kù)org/pentaho/pentaho-aggdesigner-algorithm/5.1.5-jhyde路徑下,之后進(jìn)行重新打包带到。

創(chuàng)建臨時(shí)函數(shù)與開(kāi)發(fā)好的java class關(guān)聯(lián)

在hql中使用自定義的函數(shù)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末昧碉,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子揽惹,更是在濱河造成了極大的恐慌被饿,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件搪搏,死亡現(xiàn)場(chǎng)離奇詭異狭握,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)疯溺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門论颅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人囱嫩,你說(shuō)我怎么就攤上這事恃疯。” “怎么了墨闲?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵今妄,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我损俭,道長(zhǎng)蛙奖,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任杆兵,我火速辦了婚禮雁仲,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘琐脏。我一直安慰自己攒砖,他們只是感情好缸兔,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著吹艇,像睡著了一般惰蜜。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上受神,一...
    開(kāi)封第一講書(shū)人閱讀 51,708評(píng)論 1 305
  • 那天抛猖,我揣著相機(jī)與錄音,去河邊找鬼鼻听。 笑死财著,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的撑碴。 我是一名探鬼主播撑教,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼醉拓!你這毒婦竟也來(lái)了伟姐?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤亿卤,失蹤者是張志新(化名)和其女友劉穎愤兵,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體怠噪,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡恐似,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年杜跷,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了傍念。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡葛闷,死狀恐怖憋槐,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情淑趾,我是刑警寧澤阳仔,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站扣泊,受9級(jí)特大地震影響近范,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜延蟹,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一评矩、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧阱飘,春花似錦斥杜、人聲如沸虱颗。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)忘渔。三九已至,卻和暖如春缰儿,著一層夾襖步出監(jiān)牢的瞬間畦粮,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工乖阵, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留锈玉,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓义起,卻偏偏與公主長(zhǎng)得像拉背,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子默终,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 說(shuō)來(lái)慚愧椅棺,從大學(xué)的時(shí)候就反反復(fù)復(fù)在圖書(shū)館看到這本書(shū),時(shí)隔幾年齐蔽,從未捧起來(lái)讀過(guò)两疚。周六,午睡過(guò)后含滴,在博庫(kù)書(shū)城透明玻璃的...
    是京京呀閱讀 376評(píng)論 0 2
  • 第一日:6號(hào)入伙休整一晚诱渤,芳茂茶業(yè)大小兩位李總負(fù)責(zé)接待,感受著一把天下茶人為一家的溫暖谈况,來(lái)自有6個(gè)不同省份的資深茶...
    微木2閱讀 721評(píng)論 2 1