數(shù)據(jù)分析-結(jié)構(gòu)比率歸因-定位異常原因

我們來看下面一個場景肃拜,表一是2020和2021年不同用戶群體的用戶數(shù)垛贤,以及對應(yīng)群體的付費率芬沉。表二是2020年和2021年總體的付費率下降了2.8%躺同。想問一下,我們通過表一如何分析原因丸逸?(付費率= 付費人數(shù)/總?cè)藬?shù))

表一:

年份 新注冊用戶數(shù) 活躍用戶數(shù) 召回用戶數(shù)
2020年 4 92 4
2021年 6 188 6
年份 新注冊付費率 活躍用戶付費率 召回用戶付費率
2020年 14% 21% 20%
2021年 16% 18% 17%

表二:

年份 整體付費率 差異
2020年 20.7%
2021年 17.9% -2.8%

付費率下降原因

結(jié)構(gòu)占比變化

由上表一我們可以算出來各個用戶群體蹋艺,在2020年和2021年結(jié)構(gòu)的占比,以及占比的變化:表三:

年份 新注冊用戶占比 活躍用戶占比 召回用戶占比
2020年 4% 92% 4%
2021年 3% 94% 3%
差異 -1% 2% -1%

比率-付費率變化

由上表一我們又可以算出來各個用戶群體黄刚,在2020年和2021年付費率的變化:

表四:

年份 新注冊付費率 活躍用戶付費率 召回用戶付費率
2020年 14% 21% 20%
2021年 16% 18% 17%
差異 2% -3% -3%

整體付費率變化的貢獻值

通過表三和表四车海,我們可以得到各個群體比率變動和結(jié)構(gòu)變動對于整體付費率變化的影響大小,見表五:
表五:

年份 新注用戶 活躍用戶 召回用戶
比率變動影響 0.07% -2.79% -0.11%
結(jié)構(gòu)變動影響 -0.15% 0.39% -0.19%

總的付費率變動 = 0.07%+(-2.79%)+(-0.11%)+(-0.15%)+0.39%+(-0.19%)=-2.8%。與上面表二的結(jié)果是一樣的侍芝。

結(jié)果解讀

通過表五得出來的結(jié)果研铆,我們可以看到總體付費率的變化是由于活躍用戶付費率的下降,導(dǎo)致了整體付費率的下降州叠。

那么棵红,我們是如何得到表五的數(shù)據(jù)呢?

結(jié)構(gòu)比率問題--拆解

接下來是一段長文推導(dǎo)咧栗,如有不適逆甜,忍著看完,進行思考致板。假設(shè)各群體的占比和付費率如下表六:

表六

每一部分(群體)變動的計算:

比率(付費率)變動影響:


公式1

結(jié)構(gòu)占比變動的影響:公式2

公式2

如何理解:

我們是希望把總的比率(付費率)變動分解為不同維度(用戶群體)比率變動和結(jié)構(gòu)占比變動交煞,這樣我們就能夠方便的看出:

  1. 到底是這個群體比率上升下降的原因,還是說這個群體的占比上升下降導(dǎo)致整個比率的上升下降斟或。

  2. 看整個比率變動的主要原因和次要原因素征,對其進行量化。

說完目標萝挤,接下來看看具體公式的理解御毅。

比率變動的影響:

主要是量化活躍用戶比率(付費率)的變化對于整體比率(付費率)變化的影響,我們使用AB1'-AB1怜珍,這是活躍用戶比率變化的絕對量端蛆。

但是我們考慮的是對總體比率變化的影響,所以需要乘以活躍用戶占比酥泛,但是活躍用戶占比是在變化的今豆,這里我們就直接乘以(W1'-W1)/2,使用均值來穩(wěn)定占比的變化柔袁。

這樣我們就計算出來了活躍用戶比率變化對于整體比率變化的影響了

結(jié)構(gòu)占比變動的影響:

公式1僅計算出了活躍用戶比率變化對于整體比率變化的影響呆躲,我們還需要考慮活躍用戶結(jié)構(gòu)的變化對于整體比率變化的影響,所以就有了公式2瘦馍。

公式2的理解跟公式1一樣,考慮活躍用戶結(jié)構(gòu)變化的絕對量应役,然后乘以穩(wěn)定的比率情组。

單個群體(活躍用戶)變動計算:公式3

這樣我們就能得到單個群體變動對于總體變動量

公式3

同理所有的變動就是各個群體變動相加:公式4

公式4

總體變動:

假設(shè)總體用戶為a,則總體付費比率AB可表示為:公式5

公式5

即:公式6

公式6

因此:公式7

公式7

所以,總的比率(付費率)理論上就是等于各個群體的比率變動影響和結(jié)構(gòu)變動影響相加

希望您還在看箩祥。院崇。。

希望您還在看袍祖。底瓣。。

希望您還在看。捐凭。拨扶。

接下來就是一個分渠道購買率定位問題的案例,以及對于辛普森簡單理解茁肠。

分渠道購買率--定位三板斧

話不多說患民,直接上表表七:

年份 安卓 IOS 小程序
2020年 250 200 550
2021年 900 700 400
年份 安卓付費率 ios付費率 小程序付費率
2020年 60% 60% 30%
2021年 58% 70% 40%

一、算出每個群體比率和結(jié)構(gòu)差值

表八:

年份 安卓付費率 ios付費率 小程序付費率
2020年 60% 60% 30%
2021年 58% 70% 40%
差異 -2% 10% 10%
年份 安卓占比 IOS占比 小程序占比
2020年 25% 20% 55%
2021年 45% 35% 20%
差異 20% 15% -35%

二垦梆、計算每一個渠道的貢獻

表九:

影響 安卓 IOS 小程序
比率變動影響 -0.7% 2.8% 3.8%
結(jié)構(gòu)變動影響 11.8% 9.8% -12.3%
總變動 15.1%

三匹颤、單獨計算總付費率

表十:

影響 差異
2020年付費率 43.5%
2021年付費率 58.6%
總變動 15.1%

總結(jié):

我們從表九可以看到:主要是由于安卓端占比的上升,以及IOS占比上升導(dǎo)致總體的付率從43.5%上升到58.6%

辛普森悖論的理解

什么是辛普森悖論:

當人們嘗試探究兩種變量(比如新生錄取率與性別)是否具有相關(guān)性的時候托猩,會分別對之進行分組研究印蓖。然而,在分組比較中都占優(yōu)勢的一方京腥,在總評中有時反而是失勢的一方

例如表十一赦肃,總體的付費率是在上升,但是安卓和IOS的付費率都是在下降:
表十一:

2020 2020 2020 2021 2021 2021
指標 安卓 IOS 匯總 安卓 IOS 匯總
用戶數(shù) 1600 3500 5100 8000 2000 10000
付費用戶數(shù) 120 100 220 500 40 540
付費率 7.5% 2.9% 4.3% 6.3% 2.0% 5.4%

從表十一我們很快得到表十二的數(shù)據(jù)

表十二:

年份 安卓 IOS
2020 1600 3500
2021 8000 2000
比率 安卓付費率 IOS付費率
2020 7.5% 2.9%
2021 6.3% 2.0%
差異 -1.2% -0.9%
結(jié)構(gòu) 安卓占比 IOS占比
2020 31.4% 68.6%
2021 80.0% 20.0%
差異 48.6% -48.6%
變動 安卓 IOS
比率變動 -0.7% -0.4%
結(jié)構(gòu)變動 3.4% -1.2%
總變動 1.1%

結(jié)論:
從表十二绞旅,我們可以看出主要是由于安卓的占比上升導(dǎo)致整個付費率的上升摆尝。

寫在最后:
感謝怡然同學(xué)的合作和支持。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末因悲,一起剝皮案震驚了整個濱河市堕汞,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌晃琳,老刑警劉巖讯检,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異卫旱,居然都是意外死亡人灼,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進店門顾翼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來投放,“玉大人,你說我怎么就攤上這事适贸【姆迹” “怎么了?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵拜姿,是天一觀的道長烙样。 經(jīng)常有香客問我,道長蕊肥,這世上最難降的妖魔是什么谒获? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上批狱,老公的妹妹穿的比我還像新娘裸准。我一直安慰自己,他們只是感情好精耐,可當我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布狼速。 她就那樣靜靜地躺著,像睡著了一般卦停。 火紅的嫁衣襯著肌膚如雪向胡。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天惊完,我揣著相機與錄音僵芹,去河邊找鬼。 笑死小槐,一個胖子當著我的面吹牛拇派,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播凿跳,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼件豌,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了控嗜?” 一聲冷哼從身側(cè)響起茧彤,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疆栏,沒想到半個月后曾掂,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡壁顶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年珠洗,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片若专。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡许蓖,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出调衰,到底是詐尸還是另有隱情膊爪,我是刑警寧澤,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布窖式,位于F島的核電站蚁飒,受9級特大地震影響动壤,放射性物質(zhì)發(fā)生泄漏萝喘。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望阁簸。 院中可真熱鬧爬早,春花似錦、人聲如沸启妹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽饶米。三九已至桨啃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間檬输,已是汗流浹背照瘾。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留丧慈,地道東北人析命。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像逃默,于是被迫代替她去往敵國和親鹃愤。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容