[百度]數(shù)據(jù)倉庫選型~Kylin/Drill、Presto愧沟、Impala蔬咬、Spark SQL

大數(shù)據(jù)即服務(wù)(BDaaS):大數(shù)據(jù)行業(yè)的下一個(gè)熱門丨數(shù)據(jù)工匠簡(jiǎn)報(bào)(6.20) - 簡(jiǎn)書 http://www.reibang.com/p/3a37d30005ff

百度地圖的工程師都是如何利用Apache Kylin處理數(shù)據(jù)的

百度地圖開放平臺(tái)業(yè)務(wù)部數(shù)據(jù)智能組主要負(fù)責(zé)百度地圖內(nèi)部相關(guān)業(yè)務(wù)的大數(shù)據(jù)計(jì)算分析,處理日常百億級(jí)規(guī)模數(shù)據(jù)沐寺,為不同業(yè)務(wù)提供單條SQL毫秒級(jí)響應(yīng)的OLAP多維分析查詢服務(wù)林艘。對(duì)于Apache Kylin在實(shí)際生產(chǎn)環(huán)境中的應(yīng)用,在國(guó)內(nèi)混坞,百度地圖數(shù)據(jù)智能組是最早的一批實(shí)踐者之一狐援。Apache Kylin在2014年11月開源,當(dāng)時(shí)究孕,我們團(tuán)隊(duì)正需要搭建一套完整的大數(shù)據(jù)OLAP分析計(jì)算平臺(tái)啥酱,用來提供百億行級(jí)數(shù)據(jù)單條SQL毫秒到秒級(jí)的多維分析查詢服務(wù),在技術(shù)選型過程中厨诸,我們參考了Apache Drill镶殷、Presto、Impala泳猬、Spark SQL批钠、Apache Kylin等宇植。對(duì)于Apache Drill和Presto因生產(chǎn)環(huán)境案例較少,考慮到后期遇到問題難以交互討論埋心,且Apache Drill整體發(fā)展不夠成熟指郁。對(duì)于Impala和Spark SQL,主要基于內(nèi)存計(jì)算拷呆,對(duì)機(jī)器資源要求較高闲坎,單條SQL能夠滿足秒級(jí)動(dòng)態(tài)查詢響應(yīng),但交互頁面通常含有多條SQL查詢請(qǐng)求茬斧,在超大規(guī)模數(shù)據(jù)規(guī)模下腰懂,動(dòng)態(tài)計(jì)算亦難以滿足要求。后來项秉,我們關(guān)注到了基于MapReduce預(yù)計(jì)算生成Cube并提供低延遲查詢的Apache Kylin解決方案绣溜,并于2015年2月左右在生產(chǎn)環(huán)境完成了Apache Kylin的首次完整部署。Apache Kylin是一個(gè)開源的分布式分析引擎娄蔼,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規(guī)模數(shù)據(jù)怖喻,最初由eBay Inc. 開發(fā)并貢獻(xiàn)至開源社區(qū),并于2015年11月正式畢業(yè)成為Apache頂級(jí)項(xiàng)目岁诉。
文/Datartisan數(shù)據(jù)工匠(簡(jiǎn)書作者)原文鏈接:http://www.reibang.com/p/3a37d30005ff著作權(quán)歸作者所有锚沸,轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán),并標(biāo)注“簡(jiǎn)書作者”涕癣。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末哗蜈,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子坠韩,更是在濱河造成了極大的恐慌距潘,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件同眯,死亡現(xiàn)場(chǎng)離奇詭異绽昼,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)须蜗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門硅确,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人明肮,你說我怎么就攤上這事菱农。” “怎么了柿估?”我有些...
    開封第一講書人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵循未,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng)的妖,這世上最難降的妖魔是什么绣檬? 我笑而不...
    開封第一講書人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮嫂粟,結(jié)果婚禮上娇未,老公的妹妹穿的比我還像新娘。我一直安慰自己星虹,他們只是感情好零抬,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著宽涌,像睡著了一般平夜。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上卸亮,一...
    開封第一講書人閱讀 52,441評(píng)論 1 310
  • 那天忽妒,我揣著相機(jī)與錄音,去河邊找鬼嫡良。 笑死锰扶,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的寝受。 我是一名探鬼主播,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼罕偎,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼很澄!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起颜及,我...
    開封第一講書人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤甩苛,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后俏站,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體讯蒲,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年肄扎,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了墨林。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡犯祠,死狀恐怖旭等,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情衡载,我是刑警寧澤搔耕,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布,位于F島的核電站痰娱,受9級(jí)特大地震影響弃榨,放射性物質(zhì)發(fā)生泄漏菩收。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一鲸睛、第九天 我趴在偏房一處隱蔽的房頂上張望娜饵。 院中可真熱鬧,春花似錦腊凶、人聲如沸划咐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽褐缠。三九已至,卻和暖如春风瘦,著一層夾襖步出監(jiān)牢的瞬間队魏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工万搔, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留胡桨,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓瞬雹,卻偏偏與公主長(zhǎng)得像昧谊,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子酗捌,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容