【Q&A】面對(duì)上億級(jí)別的用戶行為數(shù)據(jù)郊闯，如何做到秒級(jí)響應(yīng)分析

節(jié)前，Kyligence 的資深講師為大家?guī)?lái)了《面對(duì)上億級(jí)別的用戶行為數(shù)據(jù)贪庙，如何做到秒級(jí)響應(yīng)分析》線上分享蜘犁，介紹了如何使用 Apache Kylin 進(jìn)行用戶行為分析。錯(cuò)過(guò)直播的同學(xué)可以直接點(diǎn)擊這里獲取視頻回放止邮。

（以下為現(xiàn)場(chǎng)Q&A）

Kylin 的使用

Q：Kylin 刷新的最小單位是什么? 另外數(shù)據(jù)源可以用 MySQL 嗎这橙？

A：Kylin 最小的刷新單位是 Segment，數(shù)據(jù)源可以選擇 MySQL

Q：請(qǐng)問(wèn) Kylin 如何獲取明細(xì)數(shù)據(jù)呢导披？

A：首先通過(guò) intersect_value 計(jì)算出用戶 UID,之后根據(jù) UID 查詢明細(xì)

Q：Kylin 3.0支持實(shí)時(shí)了屈扎，如何做數(shù)據(jù)刪除和更新，歷史數(shù)據(jù)如何處理撩匕？能介紹一下嗎?

A：Kylin 的實(shí)時(shí)功能支持 lambda 模式鹰晨，用戶在數(shù)據(jù)經(jīng)過(guò) ETL 后，需要更新 cube 的數(shù)據(jù)，可以通過(guò)創(chuàng)建一個(gè) lambda 表模蜡，通過(guò)刷新 lambda 表漠趁，來(lái)實(shí)現(xiàn) cube 數(shù)據(jù)的更新具體用法參考我們的教程

Q：Hive 表的其中一個(gè)字段是數(shù)組，Kylin 可以將這個(gè)字段拆分出來(lái)么忍疾？

A：Kylin 不支持這個(gè)功能闯传，只支持基礎(chǔ)數(shù)據(jù)類型

Q：Kylin 的結(jié)果如何通過(guò) PowerBI 展示,需要什么支持的？

A：通過(guò) PowerBI 使用開(kāi)源 Kylin卤妒，可以裝 Kylin ODBC Driver丸边，使用 PowerBI 通用 ODBC 接口，開(kāi)源 Kylin 只有使用 PowerBI import 模式（PowerBI有 import + direct query 兩種模式）荚孵，商業(yè)版 Kyligence 兩種模式都支持

Q：在 BI 分析工具中還能繼續(xù)做篩選嗎妹窖？

A：現(xiàn)在 BI 工具不支持在同一個(gè)列上做多個(gè)篩選器，行為分析收叶，現(xiàn)有的 BI 工具支持不完善骄呼，需要做自研開(kāi)發(fā)

Q：UDAF 的實(shí)現(xiàn)有參考文檔嗎？

A：請(qǐng)參考 Calcite 官方文檔

Q：假設(shè)表結(jié)構(gòu)修改了判没，Kylin 能感知到嗎?

A：需要手動(dòng)刷新同步表結(jié)構(gòu)蜓萄，但是如果 cube 已經(jīng)有數(shù)據(jù)，是不能同步的澄峰。

Q：model 和 cube 的區(qū)別是什么呀嫉沽？

A：比較像面向?qū)ο笾械?Class 類與類實(shí)例之間的關(guān)系,一個(gè)Class 類可以 new 出很多個(gè)實(shí)例,同樣的一個(gè) model 可以創(chuàng)建很多個(gè) cube，model 是模型俏竞，cube 是具體的預(yù)計(jì)算方式和結(jié)果

Kylin 的性能優(yōu)化

Q：這個(gè)函數(shù)的使用對(duì)于用戶基礎(chǔ)過(guò)大的情況是否會(huì)存在數(shù)據(jù)膨脹過(guò)大的情況绸硕？

A：對(duì)于用戶基數(shù)高的不會(huì)，對(duì)于維度基數(shù)高的會(huì)存在魂毁，但可以通過(guò)設(shè)置必要維度玻佩，層級(jí)維度與聯(lián)合維度進(jìn)行控制

Q：Kylin 自動(dòng)化構(gòu)建是不是也需要外部腳本或者程序定時(shí)調(diào)度？

A：需要外部調(diào)度

Q：寬表是 cube 里的一個(gè)關(guān)聯(lián)表席楚，還是最終 cube 存儲(chǔ)成了一個(gè)寬表咬崔？

A：所謂寬表是數(shù)據(jù)源上的寬表，Kylin cube 設(shè)計(jì)可以只有一個(gè)事實(shí)表烦秩，也可以是星型模型

Q：大規(guī)模數(shù)據(jù)中垮斯，如果字典表更新了之前 cube 跑過(guò)的數(shù)據(jù)怎么辦呢，有么有辦法可以快速重新構(gòu)建的辦法?

A：目前只能重新構(gòu)建

Q：union 前后的 select 查詢是串行執(zhí)行還是并行執(zhí)行的只祠？

A：目前還是串行方式

Q：HBase 里存的是維表的快照嗎兜蠕？如果維表更新了又要重跑怎么辦？

A：HBase 中存放的是 Cuboid 數(shù)據(jù),如果維表更新了,需要重新構(gòu)建維表的存儲(chǔ)是有兩種方式除了HBase 還有 meta store铆农，具體請(qǐng)參考官網(wǎng)說(shuō)明牺氨。如果在建模時(shí)有維度表的字段選為 normal狡耻，那么維表更新是必須刷新 cube 墩剖，如果維表的字段全部為 derived猴凹，那么是不需要刷新 cube

Q：Kylin 的 rowkey 應(yīng)該是多維度組合生成的，HBase 對(duì)點(diǎn)查支持的好岭皂，但是大范圍維度查詢不友好郊霎，Kylin 在查詢多維度組合的 Cuboid 時(shí)，涵蓋很多條件時(shí)會(huì)不會(huì)很慢爷绘？

A：不一定书劝，這個(gè)要看 rowkey 的設(shè)計(jì)，在設(shè)計(jì) rowkey 的時(shí)候最好能結(jié)合查詢土至，把經(jīng)常查尋的字段和基數(shù)比較大的字段往前放购对，還可以通過(guò) shard 字段切分?jǐn)?shù)據(jù)做相應(yīng)的優(yōu)化

intersect_count 函數(shù)的使用

Q：用 intersect_count 和直接在 where 里寫 and 和 or 條件的性能是一樣的么？

A：有where 篩選條件,效率會(huì)高一點(diǎn).如果有 where 條件陶因，會(huì)首先進(jìn)行一次過(guò)濾,之后再運(yùn)行 intersect_count

Q：Tableau骡苞、Power BI 查詢 Kylin 的話也有 intersect_count 函數(shù)嗎？

A：Tableau楷扬、Power BI 沒(méi)有內(nèi)置 intersect_count 函數(shù)解幽，但是可以通過(guò)直接查詢模式使用

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市烘苹，隨后出現(xiàn)的幾起案子躲株，更是在濱河造成了極大的恐慌，老刑警劉巖镣衡，帶你破解...
沈念sama閱讀 218,682評(píng)論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件霜定，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡廊鸥，警方通過(guò)查閱死者的電腦和手機(jī)然爆，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,277評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)黍图，“玉大人曾雕，你說(shuō)我怎么就攤上這事≈唬” “怎么了剖张？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,083評(píng)論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)揩环。經(jīng)常有香客問(wèn)我搔弄，道長(zhǎng)，這世上最難降的妖魔是什么丰滑？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,763評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任顾犹，我火速辦了婚禮倒庵，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘炫刷。我一直安慰自己擎宝，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,785評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布浑玛。她就那樣靜靜地躺著绍申，像睡著了一般。火紅的嫁衣襯著肌膚如雪顾彰。梳的紋絲不亂的頭發(fā)上极阅，一...
開(kāi)封第一講書(shū)人閱讀 51,624評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音涨享，去河邊找鬼筋搏。笑死，一個(gè)胖子當(dāng)著我的面吹牛厕隧，可吹牛的內(nèi)容都是我干的奔脐。我是一名探鬼主播，決...
沈念sama閱讀 40,358評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼栏账，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼帖族！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起挡爵，我...
開(kāi)封第一講書(shū)人閱讀 39,261評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤竖般，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后茶鹃，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體涣雕，經(jīng)...
沈念sama閱讀 45,722評(píng)論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,900評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年闭翩，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了挣郭。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,030評(píng)論 1贊 350
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡疗韵，死狀恐怖兑障，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情蕉汪，我是刑警寧澤流译，帶...
沈念sama閱讀 35,737評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站者疤，受9級(jí)特大地震影響福澡，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜驹马，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,360評(píng)論 3贊 330
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一革砸、第九天我趴在偏房一處隱蔽的房頂上張望除秀。院中可真熱鬧，春花似錦算利、人聲如沸册踩。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,941評(píng)論 0贊 22
一樁弒父案笔时，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)棍好。三九已至仗岸，卻和暖如春允耿，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背扒怖。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,057評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工较锡，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人盗痒。一個(gè)月前我還...
沈念sama閱讀 48,237評(píng)論 3贊 371
代替公主和親
正文我出身青樓蚂蕴，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親俯邓。傳聞我的和親對(duì)象是個(gè)殘疾皇子骡楼，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,976評(píng)論 2贊 355

【Q&A】面對(duì)上億級(jí)別的用戶行為數(shù)據(jù)谈火，如何做到秒級(jí)響應(yīng)分析

【Q&A】面對(duì)上億級(jí)別的用戶行為數(shù)據(jù)郊闯，如何做到秒級(jí)響應(yīng)分析

A：Tableau楷扬、Power BI 沒(méi)有內(nèi)置 intersect_count 函數(shù)解幽，但是可以通過(guò)直接查詢模式使用

推薦閱讀更多精彩內(nèi)容