【Q&A】面對(duì)上億級(jí)別的用戶行為數(shù)據(jù)郊闯,如何做到秒級(jí)響應(yīng)分析

節(jié)前,Kyligence 的資深講師為大家?guī)?lái)了《面對(duì)上億級(jí)別的用戶行為數(shù)據(jù)贪庙,如何做到秒級(jí)響應(yīng)分析》線上分享蜘犁,介紹了如何使用 Apache Kylin 進(jìn)行用戶行為分析。錯(cuò)過(guò)直播的同學(xué)可以直接點(diǎn)擊這里獲取視頻回放止邮。

(以下為現(xiàn)場(chǎng)Q&A)

Kylin 的使用

Q:Kylin 刷新的最小單位是什么? 另外數(shù)據(jù)源可以用 MySQL 嗎这橙?

A:Kylin 最小的刷新單位是 Segment,數(shù)據(jù)源可以選擇 MySQL

Q:請(qǐng)問(wèn) Kylin 如何獲取明細(xì)數(shù)據(jù)呢导披?

A:首先通過(guò) intersect_value 計(jì)算出用戶 UID,之后根據(jù) UID 查詢明細(xì)

Q:Kylin 3.0支持實(shí)時(shí)了屈扎,如何做數(shù)據(jù)刪除和更新,歷史數(shù)據(jù)如何處理撩匕?能介紹一下嗎?

A:Kylin 的實(shí)時(shí)功能支持 lambda 模式鹰晨,用戶在數(shù)據(jù)經(jīng)過(guò) ETL 后,需要更新 cube 的數(shù)據(jù),可以通過(guò)創(chuàng)建一個(gè) lambda 表模蜡,通過(guò)刷新 lambda 表漠趁,來(lái)實(shí)現(xiàn) cube 數(shù)據(jù)的更新具體用法參考我們的教程

Q:Hive 表的其中一個(gè)字段是數(shù)組,Kylin 可以將這個(gè)字段拆分出來(lái)么忍疾?

A:Kylin 不支持這個(gè)功能闯传,只支持基礎(chǔ)數(shù)據(jù)類型

Q:Kylin 的結(jié)果如何通過(guò) PowerBI 展示,需要什么支持的?

A:通過(guò) PowerBI 使用開(kāi)源 Kylin卤妒,可以裝 Kylin ODBC Driver丸边,使用 PowerBI 通用 ODBC 接口,開(kāi)源 Kylin 只有使用 PowerBI import 模式(PowerBI有 import + direct query 兩種模式)荚孵,商業(yè)版 Kyligence 兩種模式都支持

Q:在 BI 分析工具中還能繼續(xù)做篩選嗎妹窖?

A:現(xiàn)在 BI 工具不支持在同一個(gè)列上做多個(gè)篩選器,行為分析收叶,現(xiàn)有的 BI 工具支持不完善骄呼,需要做自研開(kāi)發(fā)

Q:UDAF 的實(shí)現(xiàn)有參考文檔嗎?

A:請(qǐng)參考 Calcite 官方文檔

Q:假設(shè)表結(jié)構(gòu)修改了判没,Kylin 能感知到嗎?

A:需要手動(dòng)刷新同步表結(jié)構(gòu)蜓萄,但是如果 cube 已經(jīng)有數(shù)據(jù),是不能同步的澄峰。

Q:model 和 cube 的區(qū)別是什么呀嫉沽?

A:比較像面向?qū)ο笾械?Class 類與類實(shí)例之間的關(guān)系,一個(gè)Class 類可以 new 出很多個(gè)實(shí)例,同樣的一個(gè) model 可以創(chuàng)建很多個(gè) cube,model 是模型俏竞,cube 是具體的預(yù)計(jì)算方式和結(jié)果

Kylin 的性能優(yōu)化

Q:這個(gè)函數(shù)的使用對(duì)于用戶基礎(chǔ)過(guò)大的情況是否會(huì)存在數(shù)據(jù)膨脹過(guò)大的情況绸硕?

A:對(duì)于用戶基數(shù)高的不會(huì),對(duì)于維度基數(shù)高的會(huì)存在魂毁,但可以通過(guò)設(shè)置必要維度玻佩,層級(jí)維度與聯(lián)合維度進(jìn)行控制

Q:Kylin 自動(dòng)化構(gòu)建是不是也需要外部腳本或者程序定時(shí)調(diào)度?

A:需要外部調(diào)度

Q:寬表是 cube 里的一個(gè)關(guān)聯(lián)表席楚,還是最終 cube 存儲(chǔ)成了一個(gè)寬表咬崔?

A:所謂寬表是數(shù)據(jù)源上的寬表,Kylin cube 設(shè)計(jì)可以只有一個(gè)事實(shí)表烦秩,也可以是星型模型

Q:大規(guī)模數(shù)據(jù)中垮斯,如果字典表更新了之前 cube 跑過(guò)的數(shù)據(jù)怎么辦呢,有么有辦法可以快速重新構(gòu)建的辦法?

A:目前只能重新構(gòu)建

Q:union 前后的 select 查詢是串行執(zhí)行還是并行執(zhí)行的只祠?

A:目前還是串行方式

Q:HBase 里存的是維表的快照嗎兜蠕?如果維表更新了又要重跑怎么辦?

A:HBase 中存放的是 Cuboid 數(shù)據(jù),如果維表更新了,需要重新構(gòu)建維表的存儲(chǔ)是有兩種方式除了HBase 還有 meta store铆农,具體請(qǐng)參考官網(wǎng)說(shuō)明牺氨。如果在建模時(shí)有維度表的字段選為 normal狡耻,那么維表更新是必須刷新 cube 墩剖,如果維表的字段全部為 derived猴凹,那么是不需要刷新 cube

Q:Kylin 的 rowkey 應(yīng)該是多維度組合生成的,HBase 對(duì)點(diǎn)查支持的好岭皂,但是大范圍維度查詢不友好郊霎,Kylin 在查詢多維度組合的 Cuboid 時(shí),涵蓋很多條件時(shí)會(huì)不會(huì)很慢爷绘?

A:不一定书劝,這個(gè)要看 rowkey 的設(shè)計(jì),在設(shè)計(jì) rowkey 的時(shí)候最好能結(jié)合查詢土至,把經(jīng)常查尋的字段和基數(shù)比較大的字段往前放购对,還可以通過(guò) shard 字段切分?jǐn)?shù)據(jù)做相應(yīng)的優(yōu)化

intersect_count 函數(shù)的使用

Q:用 intersect_count 和直接在 where 里寫 and 和 or 條件的性能是一樣的么?

A:有where 篩選條件,效率會(huì)高一點(diǎn).如果有 where 條件陶因,會(huì)首先進(jìn)行一次過(guò)濾,之后再運(yùn)行 intersect_count

Q:Tableau骡苞、Power BI 查詢 Kylin 的話也有 intersect_count 函數(shù)嗎?

A:Tableau楷扬、Power BI 沒(méi)有內(nèi)置 intersect_count 函數(shù)解幽,但是可以通過(guò)直接查詢模式使用

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市烘苹,隨后出現(xiàn)的幾起案子躲株,更是在濱河造成了極大的恐慌,老刑警劉巖镣衡,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件霜定,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡廊鸥,警方通過(guò)查閱死者的電腦和手機(jī)然爆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)黍图,“玉大人曾雕,你說(shuō)我怎么就攤上這事≈唬” “怎么了剖张?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)揩环。 經(jīng)常有香客問(wèn)我搔弄,道長(zhǎng),這世上最難降的妖魔是什么丰滑? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任顾犹,我火速辦了婚禮倒庵,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘炫刷。我一直安慰自己擎宝,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布浑玛。 她就那樣靜靜地躺著绍申,像睡著了一般。 火紅的嫁衣襯著肌膚如雪顾彰。 梳的紋絲不亂的頭發(fā)上极阅,一...
    開(kāi)封第一講書(shū)人閱讀 51,624評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音涨享,去河邊找鬼筋搏。 笑死,一個(gè)胖子當(dāng)著我的面吹牛厕隧,可吹牛的內(nèi)容都是我干的奔脐。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼栏账,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼帖族!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起挡爵,我...
    開(kāi)封第一講書(shū)人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤竖般,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后茶鹃,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體涣雕,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年闭翩,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了挣郭。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡疗韵,死狀恐怖兑障,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蕉汪,我是刑警寧澤流译,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站者疤,受9級(jí)特大地震影響福澡,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜驹马,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一革砸、第九天 我趴在偏房一處隱蔽的房頂上張望除秀。 院中可真熱鬧,春花似錦算利、人聲如沸册踩。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)棍好。三九已至仗岸,卻和暖如春允耿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背扒怖。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工较锡, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人盗痒。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓蚂蕴,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親俯邓。 傳聞我的和親對(duì)象是個(gè)殘疾皇子骡楼,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容