Hive Hooks介紹

Hive作為SQL on Hadoop最穩(wěn)定田炭、應(yīng)用最廣泛的查詢引擎被大家所熟知通惫。但是由于基于MapReduce鼻忠,查詢執(zhí)行速度太慢而逐步引入其他的近實時查詢引擎如Presto等。值得關(guān)注的是Hive目前支持MapReduce凳兵、Tez和Spark三種執(zhí)行引擎百新,同時Hive3也會支持聯(lián)邦數(shù)據(jù)查詢的功能。所以Hive還是有很大進步的空間的庐扫。

當(dāng)然吟孙,諸如SparkSQL和Presto有著他們非常合適的應(yīng)用場景澜倦,我們的底層也是會有多種查詢引擎存在,以應(yīng)對不同業(yè)務(wù)場景的數(shù)據(jù)查詢服務(wù)杰妓。但是由于查詢引擎過多也會導(dǎo)致用戶使用體驗不好藻治,需要用戶掌握多種查詢引擎,而且要明確知道各個引擎的適用場景巷挥。而且多種SQL引擎各自提供服務(wù)會對數(shù)據(jù)倉庫建設(shè)過程中的血緣管理桩卵、權(quán)限管理、資源利用都帶來較大的困難倍宾。

之前對于底層平臺的統(tǒng)一SQL服務(wù)有考慮過在上層提供一層接口封裝雏节,進行SQL校驗、血緣管理高职、引擎推薦钩乍、查詢分發(fā)等等,但是各個引擎之間的語法差異較大怔锌,想要實現(xiàn)兼容的SQL層有點不太現(xiàn)實寥粹。最近看了快手分享的《SQL on Hadoop 在快手大數(shù)據(jù)平臺的實踐與優(yōu)化》,覺得有那么點意思埃元。大家有興趣的話可以看一看涝涤。

其實快手的實現(xiàn)核心邏輯是一樣的,有一個統(tǒng)一的SQL入口岛杀,提供SQL校驗阔拳,SQL存儲、引擎推薦类嗤、查詢分發(fā)進而實現(xiàn)血緣管理等糊肠。優(yōu)秀的是它基于Hive完成了上述工作,將Hive作為統(tǒng)一的入口而不是重新包裝一層遗锣。既利用了HiveServer2的架構(gòu)货裹,又做到了對于用戶的感知最小。而實現(xiàn)這些功能的基礎(chǔ)就是Hive Hooks黄伊,也就是本篇的重點。

Hook是一種在處理過程中攔截事件派殷,消息或函數(shù)調(diào)用的機制还最。Hive hooks是綁定到了Hive內(nèi)部的工作機制,無需重新編譯Hive毡惜。所以Hive Hook提供了使用hive擴展和集成外部功能的能力拓轻。我們可以通過Hive Hooks在查詢處理的各個步驟中運行/注入一些代碼,幫助我們實現(xiàn)想要實現(xiàn)的功能经伙。

根據(jù)鉤子的類型扶叉,它可以在查詢處理期間的不同點調(diào)用:

Pre-semantic-analyzer hooks:在Hive在查詢字符串上運行語義分析器之前調(diào)用勿锅。

Post-semantic-analyzer hooks:在Hive在查詢字符串上運行語義分析器之后調(diào)用。

Pre-driver-run hooks:在driver執(zhí)行查詢之前調(diào)用枣氧。

Post-driver-run hooks:在driver執(zhí)行查詢之后調(diào)用溢十。

Pre-execution hooks:在執(zhí)行引擎執(zhí)行查詢之前調(diào)用。請注意达吞,這個目的是此時已經(jīng)為Hive準(zhǔn)備了一個優(yōu)化的查詢計劃张弛。

Post-execution hooks:在查詢執(zhí)行完成之后以及將結(jié)果返回給用戶之前調(diào)用。

Failure-execution hooks:當(dāng)查詢執(zhí)行失敗時調(diào)用酪劫。

由以上的Hive Hooks我們都可以得出Hive SQL執(zhí)行的生命周期了吞鸭,而Hive Hooks則完整的貫穿了Hive查詢的整個生命周期。

對于Hive Hooks有了初步理解之后覆糟,后面我們會通過示例介紹如何實現(xiàn)一個Hive Hook刻剥,并且嘗試一下如何基于Hive實現(xiàn)統(tǒng)一的SQL查詢服務(wù)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末滩字,一起剝皮案震驚了整個濱河市造虏,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌踢械,老刑警劉巖酗电,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異内列,居然都是意外死亡撵术,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進店門话瞧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嫩与,“玉大人,你說我怎么就攤上這事交排』蹋” “怎么了?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵埃篓,是天一觀的道長处坪。 經(jīng)常有香客問我,道長架专,這世上最難降的妖魔是什么同窘? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮部脚,結(jié)果婚禮上想邦,老公的妹妹穿的比我還像新娘。我一直安慰自己委刘,他們只是感情好丧没,可當(dāng)我...
    茶點故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布鹰椒。 她就那樣靜靜地躺著,像睡著了一般呕童。 火紅的嫁衣襯著肌膚如雪漆际。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天拉庵,我揣著相機與錄音灿椅,去河邊找鬼。 笑死钞支,一個胖子當(dāng)著我的面吹牛茫蛹,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播烁挟,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼婴洼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了撼嗓?” 一聲冷哼從身側(cè)響起柬采,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎且警,沒想到半個月后粉捻,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡斑芜,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年肩刃,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片杏头。...
    茶點故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡盈包,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出醇王,到底是詐尸還是另有隱情呢燥,我是刑警寧澤,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布寓娩,位于F島的核電站叛氨,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏棘伴。R本人自食惡果不足惜寞埠,卻給世界環(huán)境...
    茶點故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望排嫌。 院中可真熱鬧畸裳,春花似錦缰犁、人聲如沸淳地。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽颇象。三九已至伍伤,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間遣钳,已是汗流浹背扰魂。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留蕴茴,地道東北人劝评。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像倦淀,于是被迫代替她去往敵國和親蒋畜。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容