hbase+hive應(yīng)用場景

一.Hive應(yīng)用場景
本文主要講述使用 Hive 的實(shí)踐,業(yè)務(wù)不是關(guān)鍵,簡要介紹業(yè)務(wù)場景,本次的任務(wù)是對(duì)搜索日志數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析果善。
集團(tuán)搜索剛上線不久诊笤,日志量并不大 。這些日志分布在 5 臺(tái)前端機(jī)巾陕,按小時(shí)保存讨跟,并以小時(shí)為周期定時(shí)將上一小時(shí)產(chǎn)生的數(shù)據(jù)同步到日志分析機(jī),統(tǒng)計(jì)數(shù)據(jù)要求按小時(shí)更新鄙煤。這些統(tǒng)計(jì)項(xiàng)晾匠,

包括關(guān)鍵詞搜索量 pv ,類別訪問量凉馆,每秒訪問量 tps 等等。
基于 Hive 亡资,我們將這些數(shù)據(jù)按天為單位建表澜共,每天一個(gè)表,后臺(tái)腳本根據(jù)時(shí)間戳將每小時(shí)同步過來的 5 臺(tái)前端機(jī)的日志數(shù)據(jù)合并成一個(gè)日志文件,導(dǎo)入 Hive 系統(tǒng)咬扇,每小時(shí)同步的日志數(shù)據(jù)

被追加到當(dāng)天數(shù)據(jù)表中,導(dǎo)入完成后来惧,當(dāng)天各項(xiàng)統(tǒng)計(jì)項(xiàng)將被重新計(jì)算并輸出統(tǒng)計(jì)結(jié)果冗栗。
以上需求若直接基于 hadoop 開發(fā),需要自行管理數(shù)據(jù)供搀,針對(duì)多個(gè)統(tǒng)計(jì)需求開發(fā)不同的 map/reduce 運(yùn)算任務(wù)隅居,對(duì)合并、排序等多項(xiàng)操作進(jìn)行定制葛虐,并檢測(cè)任務(wù)運(yùn)行狀態(tài)胎源,工作量并不小。但

使用 Hive 屿脐,從導(dǎo)入到分析涕蚤、排序、去重的诵、結(jié)果輸出万栅,這些操作都可以運(yùn)用 hql 語句來解決,一條語句經(jīng)過處理被解析成幾個(gè)任務(wù)來運(yùn)行西疤,即使是關(guān)鍵詞訪問量增量這種需要同時(shí)訪問多天數(shù)

據(jù)的較為復(fù)雜的需求也能通過表關(guān)聯(lián)這樣的語句自動(dòng)完 成烦粒,節(jié)省了大量工作量。
二.hbase應(yīng)用場景
1代赁、爬蟲網(wǎng)站URL的寫入扰她。
2、淘寶在2011年之前所有的后端持久化存儲(chǔ)基本上都是在mysql上進(jìn)行的(不排除少量oracle/bdb/tair/mongdb等)芭碍,mysql由于開源徒役,并且生態(tài)系統(tǒng)良好,本身擁有分庫分表等多種解決方案窖壕,因此很長一段時(shí)間內(nèi)都滿足淘寶大量業(yè)務(wù)的需求忧勿。
但是由于業(yè)務(wù)的多樣化發(fā)展,有越來越多的業(yè)務(wù)系統(tǒng)的需求開始發(fā)生了變化瞻讽。一般來說有以下幾類變化:
數(shù)據(jù)量變得越來越多狐蜕,事實(shí)上現(xiàn)在淘寶幾乎任何一個(gè)與用戶相關(guān)的在線業(yè)務(wù)的數(shù)據(jù)量都在億級(jí)別,每日系統(tǒng)調(diào)用次數(shù)從億到百億都有卸夕,且歷史數(shù)據(jù)不能輕易刪除层释。這需要有一個(gè)海量分布式文件系統(tǒng),能對(duì)TB級(jí)甚至PB級(jí)別的數(shù)據(jù)提供在線服務(wù)
數(shù)據(jù)量的增長很快且不一定能準(zhǔn)確預(yù)計(jì)快集,大多數(shù)應(yīng)用系統(tǒng)從上線起在一段時(shí)間內(nèi)數(shù)據(jù)量都呈很快的上升趨勢(shì)贡羔,因此從成本的角度考慮對(duì)系統(tǒng)水平擴(kuò)展能力有比較強(qiáng)烈的需求廉白,且不希望存在單點(diǎn)制約
只需要簡單的kv讀取,沒有復(fù)雜的join等需求乖寒。但對(duì)系統(tǒng)的并發(fā)能力以及吞吐量猴蹂、響應(yīng)延時(shí)有非常高的需求,并且希望系統(tǒng)能夠保持強(qiáng)一致性
通常系統(tǒng)的寫入非常頻繁楣嘁,尤其是大量系統(tǒng)依賴于實(shí)時(shí)的日志分析
希望能夠快速讀取批量數(shù)據(jù)
三.總結(jié)
hive大數(shù)據(jù)計(jì)算,基于reducemap
hbase大數(shù)據(jù)存儲(chǔ),寫入和讀取

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末磅轻,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子逐虚,更是在濱河造成了極大的恐慌聋溜,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件叭爱,死亡現(xiàn)場離奇詭異撮躁,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)买雾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門把曼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人漓穿,你說我怎么就攤上這事嗤军。” “怎么了晃危?”我有些...
    開封第一講書人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵叙赚,是天一觀的道長。 經(jīng)常有香客問我山害,道長,這世上最難降的妖魔是什么沿量? 我笑而不...
    開封第一講書人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任浪慌,我火速辦了婚禮,結(jié)果婚禮上朴则,老公的妹妹穿的比我還像新娘权纤。我一直安慰自己,他們只是感情好乌妒,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開白布汹想。 她就那樣靜靜地躺著,像睡著了一般撤蚊。 火紅的嫁衣襯著肌膚如雪古掏。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,146評(píng)論 1 297
  • 那天侦啸,我揣著相機(jī)與錄音槽唾,去河邊找鬼丧枪。 笑死,一個(gè)胖子當(dāng)著我的面吹牛庞萍,可吹牛的內(nèi)容都是我干的拧烦。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼钝计,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼恋博!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起私恬,我...
    開封第一講書人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤债沮,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后践付,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秦士,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年永高,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了隧土。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡命爬,死狀恐怖曹傀,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情饲宛,我是刑警寧澤皆愉,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站艇抠,受9級(jí)特大地震影響幕庐,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜家淤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一异剥、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧絮重,春花似錦冤寿、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至狠角,卻和暖如春号杠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背丰歌。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來泰國打工究流, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留辣吃,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓芬探,卻偏偏與公主長得像神得,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子偷仿,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353