??Hive.分組排序和TOP

hive中使用標(biāo)準(zhǔn)sql實(shí)現(xiàn)分組內(nèi)排序 - 數(shù)據(jù)庫(kù)其他綜合 - 紅黑聯(lián)盟 http://www.2cto.com/database/201305/210816.html
hive中使用標(biāo)準(zhǔn)sql實(shí)現(xiàn)分組內(nèi)排序

在hive中掂碱,想要實(shí)現(xiàn)分組內(nèi)排序拜轨,一般都是自己寫(xiě)udf實(shí)現(xiàn)oracle中分析函數(shù)row_number() over(partition)的功能,如果不使用自定義udf,僅使用標(biāo)準(zhǔn)sql實(shí)現(xiàn)的話上祈,毫無(wú)性能可言,僅做實(shí)驗(yàn)而已廊镜。


Hive.分組排序和TOP - 辰采星 - 博客頻道 - CSDN.NET http://blog.csdn.net/mashroomxl/article/details/23864685

HQL作為類(lèi)SQL的查詢(xún)分析語(yǔ)言即碗,到目前為止,應(yīng)該也還未能達(dá)到其它流行的SQL(如Transact-SQL, MySQL)實(shí)現(xiàn)那樣完善搞疗。而在公司的生產(chǎn)環(huán)境中嗓蘑,我想應(yīng)該也不會(huì)緊貼Hive版本更新的步伐须肆,始終部署最新版的Hive;可能會(huì)滯后一兩個(gè)大版本神馬的桩皿;畢竟豌汇,雖然開(kāi)源工具的透明性是一大利好,但與閉源的商業(yè)工具相比泄隔,在可用性等問(wèn)題上的保障性還是略弱拒贱。
使用HQL進(jìn)行離線分析用戶(hù)數(shù)據(jù)時(shí),就算已經(jīng)過(guò)聚合處理佛嬉,但我們也可能只對(duì)那些突出的量化指標(biāo)或者這些指標(biāo)的增量變化感興趣逻澳,所以對(duì)聚合數(shù)據(jù)排序(按某列降序?增序暖呕?)成為很基本的需要斜做,這在HQL這樣尚未成熟的語(yǔ)言中,結(jié)合orderby, limit子句可以毫無(wú)鴨梨地完成湾揽。
然而瓤逼,即使我們可以把多個(gè)字段放入order by子句中,并指定各個(gè)字段的升降順序库物,如:

[sql] view plain copy
print?

派生到我的代碼片
派生到我的代碼片

order by fieldA desc, fieldB [asc], fieldC desc

   但排序操作始終是全局的霸旗,我們有時(shí)候想要的卻是分組排序,即按fieldA排序以后艳狐,然后針對(duì)fieldA的每個(gè)值所對(duì)應(yīng)的fieldB和(或)fieldC排序定硝,而不是像order by那樣,針對(duì)所有fieldA的值對(duì)fieldB和(或)fieldC排序毫目。
   為了滿(mǎn)足這個(gè)需要蔬啡,Transact-SQL提供了over, partition by句和 row_number()函數(shù),而Hive也在0.11中引入over, partition by子句和rank函數(shù)镀虐,以此提供方便的窗口分析(分組分析)功能箱蟆。
   那對(duì)于0.11版之前的Hive,我們可以實(shí)現(xiàn)分組排序嗎刮便?答案是肯定的空猜,只是看起來(lái)沒(méi)那么直接。
   要實(shí)現(xiàn)這個(gè)需求恨旱,就需要請(qǐng)出distribute by, sort by這兩個(gè)重要角色了辈毯,distribute by能夠執(zhí)行我們需要的分組功能,再結(jié)合Hive查詢(xún)的MapReduce Job特性搜贤,sort by又可以在分組內(nèi)進(jìn)行局部排序谆沃。
   當(dāng)然,如果只有它們仪芒,我們只能得到排序后的一堆數(shù)據(jù)唁影,但是無(wú)法知道每一條數(shù)據(jù)的名次耕陷,這就要自己編寫(xiě)UDF函數(shù),來(lái)確定和返回名次了据沈,這個(gè)函數(shù)貌似在網(wǎng)絡(luò)上流傳甚廣:
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末哟沫,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子锌介,更是在濱河造成了極大的恐慌嗜诀,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,496評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件掏湾,死亡現(xiàn)場(chǎng)離奇詭異裹虫,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)融击,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,187評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)筑公,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人尊浪,你說(shuō)我怎么就攤上這事匣屡。” “怎么了拇涤?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,091評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵捣作,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我鹅士,道長(zhǎng)券躁,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,458評(píng)論 1 283
  • 正文 為了忘掉前任掉盅,我火速辦了婚禮也拜,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘趾痘。我一直安慰自己慢哈,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,542評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布永票。 她就那樣靜靜地躺著卵贱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪侣集。 梳的紋絲不亂的頭發(fā)上键俱,一...
    開(kāi)封第一講書(shū)人閱讀 49,802評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音世分,去河邊找鬼编振。 笑死,一個(gè)胖子當(dāng)著我的面吹牛罚攀,可吹牛的內(nèi)容都是我干的党觅。 我是一名探鬼主播,決...
    沈念sama閱讀 38,945評(píng)論 3 407
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼斋泄,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼杯瞻!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起炫掐,我...
    開(kāi)封第一講書(shū)人閱讀 37,709評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤魁莉,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后募胃,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體旗唁,經(jīng)...
    沈念sama閱讀 44,158評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,502評(píng)論 2 327
  • 正文 我和宋清朗相戀三年痹束,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了检疫。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,637評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡祷嘶,死狀恐怖屎媳,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情论巍,我是刑警寧澤烛谊,帶...
    沈念sama閱讀 34,300評(píng)論 4 329
  • 正文 年R本政府宣布,位于F島的核電站嘉汰,受9級(jí)特大地震影響丹禀,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鞋怀,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,911評(píng)論 3 313
  • 文/蒙蒙 一双泪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧接箫,春花似錦攒读、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,744評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至废累,卻和暖如春邓梅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背邑滨。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,982評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工日缨, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人掖看。 一個(gè)月前我還...
    沈念sama閱讀 46,344評(píng)論 2 360
  • 正文 我出身青樓匣距,卻偏偏與公主長(zhǎng)得像面哥,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子毅待,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,500評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容