用戶來(lái)源去向SQL案例(附思路)

最近遇到一道關(guān)于用戶來(lái)源及去向的SQL題目,當(dāng)時(shí)思考的時(shí)候存在考慮不周全的地方铺呵,故專門模擬數(shù)據(jù)從問(wèn)題出發(fā)重新整理思路分享出來(lái)愕秫。

案例

現(xiàn)有一批數(shù)據(jù)記錄為某天多個(gè)用戶app的使用情況丧肴,數(shù)據(jù)存放在record表中蘸劈,其中有四個(gè)字段類型:

  1. id:記錄的id標(biāo)識(shí)
  2. user_id:用戶的id標(biāo)識(shí)
  3. app_name:用戶打開app的應(yīng)用名稱
  4. create_time:用戶打開app的時(shí)間
record表記錄

現(xiàn)要求得不同來(lái)源去向的用戶數(shù),即淘寶->京東弦叶、京東->唯品會(huì)等來(lái)源去向的用戶數(shù)俊犯,并寫出對(duì)應(yīng)的SQL語(yǔ)句。

思路及解答

首先伤哺,觀察數(shù)據(jù)后發(fā)現(xiàn)用戶可能有多次打開同一app和用戶只打開一個(gè)app的情況瘫析。其次,打開app的時(shí)間都在某天所以這里不考慮按不同天來(lái)計(jì)算默责。這里我們需要將原問(wèn)題拆解為小問(wèn)題,需要思考的問(wèn)題有(如有遺漏可在評(píng)論區(qū)留言):

  1. 如何表示用戶使用app的來(lái)源及去向咸包?
  2. 怎么判斷app的使用順序桃序?
  3. 用戶多次打開app會(huì)不會(huì)影響統(tǒng)計(jì)結(jié)果?
  4. 用戶只打開一個(gè)app并沒有去向如何處理烂瘫?
  5. 如何計(jì)算不同來(lái)源去向的用戶數(shù)媒熊?

解決問(wèn)題1和2需要查詢到用打開app后下一個(gè)打開app是哪個(gè)。在SQL語(yǔ)言里面如果要得到兩兩交叉的結(jié)果坟比,需要使用到交叉關(guān)聯(lián)芦鳍,同時(shí)需要是同個(gè)用戶打開的app,具體實(shí)現(xiàn)代碼如下:

SELECT
    a.user_id,
    a.app_name AS start_app,
    a.create_time AS start_time,
    b.app_name AS end_app,
    b.create_time AS end_time
FROM record a
JOIN record b
WHERE a.user_id = b.user_id
查詢1的結(jié)果

從上圖的查詢結(jié)果可以看到兩個(gè)問(wèn)題葛账,交叉關(guān)聯(lián)后來(lái)源與去向重合柠衅,來(lái)源app打開時(shí)間要大于去向打開時(shí)間。于是我們需要添加兩個(gè)條件即start_app不等于end_app籍琳,start_time要小于end_time菲宴,修改后的代碼如下:

SELECT
    a.user_id,
    a.app_name AS start_app,
    a.create_time AS start_time,
    b.app_name AS end_app,
    b.create_time AS end_time
FROM record a
JOIN record b
WHERE a.user_id = b.user_id
AND a.app_name != b.app_name
AND a.create_time < b.create_time
查詢2的結(jié)果

這樣的處理同時(shí)問(wèn)題4也解決贷祈,因?yàn)楫?dāng)用戶只打開一個(gè)app的時(shí)候交叉關(guān)聯(lián)后去向app還是自身,所以在上述操作中已經(jīng)過(guò)濾喝峦。從上圖可以發(fā)現(xiàn)1001用戶在打開唯品會(huì)前打開過(guò)兩次淘寶势誊,故有兩條來(lái)源去向的記錄,這里就會(huì)造成重復(fù)統(tǒng)計(jì)谣蠢,所以我們需要用戶最后一次的來(lái)源去向記錄即可粟耻,具體修改如下:

SELECT
    a.user_id,
    a.app_name AS start_app,
    MAX(a.create_time) AS start_time,
    b.app_name AS end_app,
    b.create_time AS end_time
FROM record a
JOIN record b
WHERE a.user_id = b.user_id
AND a.app_name != b.app_name
AND a.create_time < b.create_time
GROUP BY a.user_id, a.app_name, b.app_name
查詢3的結(jié)果

現(xiàn)在,我們需要計(jì)算不同來(lái)源去向的用戶占比眉踱,即求得來(lái)源和去向分組后的user_id除重的結(jié)果挤忙,具體實(shí)現(xiàn)代碼如下:

SELECT
    start_app,
    end_app,
    COUNT(DISTINCT user_id) AS user_num
FROM (
SELECT
    a.user_id,
    a.app_name AS start_app,
    MAX(a.create_time) AS start_time,
    b.app_name AS end_app,
    b.create_time AS end_time
FROM record a
JOIN record b
WHERE a.user_id = b.user_id
AND a.app_name != b.app_name
AND a.create_time < b.create_time
GROUP BY a.user_id, a.app_name, b.app_name
) groups
GROUP BY start_app, end_app
最后匯總的結(jié)果

總結(jié)

做SQL題目與寫代碼一樣,重要的是能得到最終的結(jié)果勋锤,故查詢效率最后考慮饭玲,需要優(yōu)先考慮查詢后的結(jié)果是否需要進(jìn)行篩選以及重復(fù)記錄的情況。將問(wèn)題拆解為小問(wèn)題有助于降低問(wèn)題難度叁执,同時(shí)也能對(duì)多方面有所考慮茄厘。總的來(lái)說(shuō)這道SQL題目并不難谈宛,關(guān)鍵在于思路是否清晰次哈,其次才是基礎(chǔ)知識(shí)的考驗(yàn)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末吆录,一起剝皮案震驚了整個(gè)濱河市窑滞,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌恢筝,老刑警劉巖哀卫,帶你破解...
    沈念sama閱讀 207,113評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異撬槽,居然都是意外死亡此改,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門侄柔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)共啃,“玉大人,你說(shuō)我怎么就攤上這事暂题∫萍簦” “怎么了?”我有些...
    開封第一講書人閱讀 153,340評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵薪者,是天一觀的道長(zhǎng)纵苛。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么赶站? 我笑而不...
    開封第一講書人閱讀 55,449評(píng)論 1 279
  • 正文 為了忘掉前任幔虏,我火速辦了婚禮,結(jié)果婚禮上贝椿,老公的妹妹穿的比我還像新娘想括。我一直安慰自己,他們只是感情好烙博,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,445評(píng)論 5 374
  • 文/花漫 我一把揭開白布瑟蜈。 她就那樣靜靜地躺著,像睡著了一般渣窜。 火紅的嫁衣襯著肌膚如雪铺根。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,166評(píng)論 1 284
  • 那天乔宿,我揣著相機(jī)與錄音位迂,去河邊找鬼。 笑死详瑞,一個(gè)胖子當(dāng)著我的面吹牛掂林,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播坝橡,決...
    沈念sama閱讀 38,442評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼泻帮,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了计寇?” 一聲冷哼從身側(cè)響起锣杂,我...
    開封第一講書人閱讀 37,105評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎番宁,沒想到半個(gè)月后元莫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,601評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蝶押,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,066評(píng)論 2 325
  • 正文 我和宋清朗相戀三年踱蠢,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片播聪。...
    茶點(diǎn)故事閱讀 38,161評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖布隔,靈堂內(nèi)的尸體忽然破棺而出离陶,到底是詐尸還是另有隱情,我是刑警寧澤衅檀,帶...
    沈念sama閱讀 33,792評(píng)論 4 323
  • 正文 年R本政府宣布招刨,位于F島的核電站,受9級(jí)特大地震影響哀军,放射性物質(zhì)發(fā)生泄漏沉眶。R本人自食惡果不足惜打却,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,351評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望谎倔。 院中可真熱鬧柳击,春花似錦、人聲如沸片习。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)藕咏。三九已至状知,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間孽查,已是汗流浹背饥悴。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留盲再,地道東北人西设。 一個(gè)月前我還...
    沈念sama閱讀 45,618評(píng)論 2 355
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像洲胖,于是被迫代替她去往敵國(guó)和親济榨。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,916評(píng)論 2 344

推薦閱讀更多精彩內(nèi)容