用戶七日留存率分析

背景

APP分析中經(jīng)常用到AARRR模型(海盜模型)用來分析APP的現(xiàn)狀,其中一個重要節(jié)點就是提高留存(Acquisition)促煮,而留存率這個指標(biāo)在這個階段可以說是核心指標(biāo)也不為過俱萍。那如何用SQL計算留存率呢?

留存率計算方法

假如今天新增了100名用戶颂翼,第二天登陸了50名,則次日留存率為50/100=50%慨灭,第三天登錄了30名朦乏,則第二日留存率為30/100=30%,以此類推。

用SQL的計算思路

  • 用SQL調(diào)取出user_id和用戶login_time的表氧骤,獲得新增用戶登錄時間表呻疹。
    根據(jù)user_id和login_time,增加一列first_day筹陵,此列存著每個用戶最早登錄時間刽锤。
    有了最早登錄時間和所有的登錄時間镊尺,再增加一列by_day,這一列是用login_time - first_day 并思,得到0庐氮,1,2宋彼,3弄砍,4,5......宙暇,這就得到了某一天登錄離第一次登錄有多長時間输枯。


  • 然后從表中提取數(shù)據(jù),找到first_day對應(yīng)的with_first列中0有多少個占贫,1有多少個桃熄,一直到7以上。



    根據(jù)此表型奥,就很容易計算出每天引流的留存率瞳收。

實際操作

數(shù)據(jù):是我用excel隨便模擬的數(shù)據(jù),與真實情況不符厢汹。



數(shù)據(jù)庫:MySQL

步驟一:從數(shù)據(jù)庫中提取出user_id和login_time并排序

select 
    user_id,
    str_to_date(login_time,'%Y/%m/%d') login_time
from user_info
group by 1,2;

步驟二:增加一列first_day螟深,存儲每個用戶ID最早登錄時間

SELECT
    b.user_id,
    b.login_time,
    c.first_day
FROM 
    (select 
        user_id,
        str_to_date(login_time,'%Y/%m/%d') login_time
    from user_info
    group by 1,2) b
LEFT JOIN
    (SELECT       ---找到user_id對應(yīng)的最早登錄時間,然后匹配帶登錄時間的user_id
        user_id,
        min(login_time) first_day
    FROM 
       (select 
            user_id,
            str_to_date(login_time,'%Y/%m/%d') login_time
        from user_info
        group by 1,2) a
    group by 1) c
on b.user_id = c.user_id
order by 1,2;

步驟三:用登錄時間-最早登錄時間得到一列by_day

SELECT 
    user_id,
    login_time,
    first_day,
    DATEDIFF(login_time,first_day) as by_day
FROM
  (SELECT
      b.user_id,
      b.login_time,
      c.first_day
  FROM 
      (SELECT
          user_id,
          str_to_date(login_time,'%Y/%m/%d') login_time
       FROM user_info
       GROUP BY 1,2) b
  LEFT JOIN
    (SELECT
        user_id,
        min(login_time) first_day
     FROM
         (select 
              user_id,
              str_to_date(login_time,'%Y/%m/%d') login_time
          from user_info
          group by 1,2) a
     group by 1) c
   on b.user_id = c.user_id
   order by 1,2) e
order by 1,2

最后一步:提取字段作為列名

SELECT
    first_day,
    sum(case when by_day = 0 then 1 else 0 end) day_0,
    sum(case when by_day = 1 then 1 else 0 end) day_1,
    sum(case when by_day = 2 then 1 else 0 end) day_2,
    sum(case when by_day = 3 then 1 else 0 end) day_3,
    sum(case when by_day = 4 then 1 else 0 end) day_4,
    sum(case when by_day = 5 then 1 else 0 end) day_5,
    sum(case when by_day = 6 then 1 else 0 end) day_6,
    sum(case when by_day >= 7 then 1 else 0 end) day_7plus
FROM
   (SELECT 
      user_id,
      login_time,
      first_day,
      DATEDIFF(login_time,first_day) as by_day
   FROM
     (SELECT
        b.user_id,
        b.login_time,
        c.first_day
      FROM 
        (SELECT
            user_id,
            str_to_date(login_time,'%Y/%m/%d') login_time
         FROM user_info
         GROUP BY 1,2) b
    LEFT JOIN
      (SELECT
          user_id,
          min(login_time) first_day
       FROM
           (select 
                user_id,
                str_to_date(login_time,'%Y/%m/%d') login_time
            FROM 
                user_info
            group by 1,2) a
       group by 1) c
     on b.user_id = c.user_id
     order by 1,2) e
  order by 1,2) f
group by 1
order by 1

結(jié)語

根據(jù)最后得到的數(shù)據(jù)烫葬,我們直接用除法或者加一個SQL語句界弧,就能算出來留存率,之后的分析就是看自己了搭综。

參考博客

https://blog.treasuredata.com/blog/2016/07/22/rolling-retention-done-right-in-sql/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末垢箕,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子兑巾,更是在濱河造成了極大的恐慌条获,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蒋歌,死亡現(xiàn)場離奇詭異帅掘,居然都是意外死亡,警方通過查閱死者的電腦和手機堂油,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進店門修档,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人府框,你說我怎么就攤上這事萍悴。” “怎么了?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵癣诱,是天一觀的道長计维。 經(jīng)常有香客問我,道長撕予,這世上最難降的妖魔是什么鲫惶? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮实抡,結(jié)果婚禮上欠母,老公的妹妹穿的比我還像新娘。我一直安慰自己吆寨,他們只是感情好赏淌,可當(dāng)我...
    茶點故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著啄清,像睡著了一般六水。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上辣卒,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天掷贾,我揣著相機與錄音,去河邊找鬼荣茫。 笑死想帅,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的啡莉。 我是一名探鬼主播港准,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼咧欣!你這毒婦竟也來了浅缸?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤该押,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后阵谚,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蚕礼,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年梢什,在試婚紗的時候發(fā)現(xiàn)自己被綠了奠蹬。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,117評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡嗡午,死狀恐怖囤躁,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤狸演,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布言蛇,位于F島的核電站,受9級特大地震影響宵距,放射性物質(zhì)發(fā)生泄漏腊尚。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一满哪、第九天 我趴在偏房一處隱蔽的房頂上張望婿斥。 院中可真熱鬧,春花似錦哨鸭、人聲如沸民宿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽活鹰。三九已至,卻和暖如春坟桅,著一層夾襖步出監(jiān)牢的瞬間华望,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工仅乓, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留赖舟,地道東北人。 一個月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓夸楣,卻偏偏與公主長得像宾抓,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子豫喧,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,060評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 背景 APP分析中經(jīng)常用到AARRR模型(海島模型)用來分析APP的現(xiàn)狀石洗,其中一個重要節(jié)點就是提高留存(Acqui...
    amyhy閱讀 996評論 0 2
  • 背景 APP分析中經(jīng)常用到AARRR模型(海盜模型)用來分析APP的現(xiàn)狀,其中一個重要節(jié)點就是提高留存(Acqui...
    成鵬9閱讀 40,921評論 17 41
  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,457評論 0 13
  • 一紧显、Python簡介和環(huán)境搭建以及pip的安裝 4課時實驗課主要內(nèi)容 【Python簡介】: Python 是一個...
    _小老虎_閱讀 5,746評論 0 10
  • ORA-00001: 違反唯一約束條件 (.) 錯誤說明:當(dāng)在唯一索引所對應(yīng)的列上鍵入重復(fù)值時讲衫,會觸發(fā)此異常。 O...
    我想起個好名字閱讀 5,320評論 0 9