基于clickhouse研發(fā)高性能 用戶分群 操作

背景

DCP是目前大多數(shù)公司在進(jìn)行用戶精細(xì)化運(yùn)營和市場營銷中常用的工具藕坯,其核心的技術(shù)是快速生成用戶群矮冬;舉個(gè)栗子铃绒,運(yùn)營同學(xué)希望對用戶表里當(dāng)日注冊用戶宝穗,且訂單表里當(dāng)日有下單的用戶進(jìn)行加積分操作户秤,那么一般的處理思路是將兩張表按照用戶id進(jìn)行join,然后根據(jù)日期進(jìn)行篩選逮矛,最終得到想要的用戶群鸡号。
這種方案流程是可行的,但研發(fā)成本較高须鼎,需要基于前端交互解析成靈活的sql鲸伴,而且關(guān)聯(lián)查詢很難保障查詢效率。


案例

那么基于以上問題晋控,這里將使用多數(shù)據(jù)表交汞窗、叉、并操作實(shí)現(xiàn)用戶群的生成赡译,該方法針對百萬級用戶群生成可秒出仲吏。

如針對滿足以下條件的用戶發(fā)放會(huì)員折扣券:
針對當(dāng)天注冊新用戶中,身份為非會(huì)員用戶,且當(dāng)日有過作品創(chuàng)建裹唆;或者當(dāng)日有會(huì)員下單記錄但未成功支付的用戶

實(shí)現(xiàn)

1誓斥、根據(jù)用戶表(千萬級)生成當(dāng)日注冊子集

SELECT groupUniqArray( create_user ) from app.scene_model where create_time = now

2、根據(jù)身份表(十萬級)生成子集

SELECT groupUniqArray( user_id) from app.user_type where create_time = now and type = 0

3许帐、根據(jù)作品表(億級)生成子集

SELECT groupUniqArray( user_id) from app.scene_model where create_time = now  

4劳坑、根據(jù)訂單表(千萬級)生成子集

SELECT groupUniqArray( user_id) from app.order_model where create_time = now and success = 0

那么我們對前三個(gè)用戶子集進(jìn)行求交,再與第四個(gè)用戶子集取并將得到我們想要的用戶群舞吭。最終代碼如下:

with ( SELECT groupUniqArray( create_user ) from app.scene_model where create_time = now )as users1,     
 ( SELECT groupUniqArray( user_id) from app.user_type where create_time = now and type = 0 )as users2 ,    
 ( SELECT groupUniqArray( user_id) from app.scene_model where create_time = now ) as users3  , 
 ( SELECT groupUniqArray( user_id) from app.scene_model where create_time = now )  as users4   
SELECT   arrayDistinct( arrayConcat( arrayIntersect( users1,users2, users3)  ,users4 ) ) as user_ids

優(yōu)化

1泡垃、由于用戶選擇數(shù)據(jù)集的過程是順序完成的,所以當(dāng)用戶完成一個(gè)數(shù)據(jù)子集后可對其進(jìn)行緩存羡鸥,在求交時(shí)性能會(huì)大幅提升

create table users1 ENGINE =   Memory  
  as 
SELECT groupUniqArray( create_user ) from app.scene_model where create_time = now

2蔑穴、對群結(jié)果進(jìn)行緩存

create table uids engin=Memory as  SELECT   arrayDistinct( arrayConcat( arrayIntersect( users1,users2, users3)  ,users4 ) ) 
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市惧浴,隨后出現(xiàn)的幾起案子存和,更是在濱河造成了極大的恐慌,老刑警劉巖衷旅,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件捐腿,死亡現(xiàn)場離奇詭異,居然都是意外死亡柿顶,警方通過查閱死者的電腦和手機(jī)茄袖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嘁锯,“玉大人宪祥,你說我怎么就攤上這事〖页耍” “怎么了蝗羊?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長仁锯。 經(jīng)常有香客問我耀找,道長,這世上最難降的妖魔是什么业崖? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任野芒,我火速辦了婚禮,結(jié)果婚禮上双炕,老公的妹妹穿的比我還像新娘复罐。我一直安慰自己,他們只是感情好雄家,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布效诅。 她就那樣靜靜地躺著胀滚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪乱投。 梳的紋絲不亂的頭發(fā)上咽笼,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天,我揣著相機(jī)與錄音戚炫,去河邊找鬼剑刑。 笑死,一個(gè)胖子當(dāng)著我的面吹牛双肤,可吹牛的內(nèi)容都是我干的施掏。 我是一名探鬼主播,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼茅糜,長吁一口氣:“原來是場噩夢啊……” “哼七芭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蔑赘,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤狸驳,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后缩赛,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體耙箍,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年酥馍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辩昆。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,117評論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡旨袒,死狀恐怖卤材,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情峦失,我是刑警寧澤,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布术吗,位于F島的核電站尉辑,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏较屿。R本人自食惡果不足惜隧魄,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望隘蝎。 院中可真熱鬧购啄,春花似錦、人聲如沸嘱么。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至几迄,卻和暖如春蔚龙,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背映胁。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工木羹, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人解孙。 一個(gè)月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓坑填,卻偏偏與公主長得像,于是被迫代替她去往敵國和親弛姜。 傳聞我的和親對象是個(gè)殘疾皇子脐瑰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評論 2 355