老板:這個功能上線长捧,效果怎么變差了,分析下什么原因部服?
PM 內(nèi)心:MMP唆姐,難道不是自然波動嗎?
工作中經(jīng)常需要數(shù)據(jù)分析,但有時原因真的很難找茂装《嗤或者就算覺得找到了,也難以用數(shù)據(jù)證明声功。有時找到了方向,取了一大堆數(shù)宠叼,算了半天先巴,發(fā)現(xiàn)缺少某個維度的數(shù)據(jù)其爵,又要重新求著數(shù)據(jù)部門要數(shù)據(jù)。找到了想要的數(shù)據(jù)伸蚯,又恨自己數(shù)到用時EXCEL技能少摩渺。總之剂邮,一到數(shù)據(jù)分析要耗費不少時間摇幻。
不過沒關(guān)系,今天3個步驟教大家高效的數(shù)據(jù)分析方法挥萌。其實绰姻,EXCEL 這些工具技巧真的沒那么重要,數(shù)據(jù)分析困難和費時主要還是提煉思路的部分引瀑。這個部分想清楚了狂芋,自然就高效了。
步驟一:拋開預(yù)設(shè)結(jié)論憨栽,窮盡維度搜集數(shù)據(jù)
通常產(chǎn)品上線一周帜矾,會有一些關(guān)于上線效果的推測的結(jié)論。
但在這一步徒像,不要直接根據(jù)假設(shè)取數(shù)黍特,而要搜集產(chǎn)品維度相關(guān)的所有數(shù)據(jù)。
我們往往會先依據(jù)預(yù)設(shè)假設(shè)去要數(shù)據(jù)锯蛀。而一旦從數(shù)據(jù)中發(fā)現(xiàn)其他問題灭衷,又要再次要數(shù)據(jù),從頭分析旁涤,浪費時間翔曲。
舉個具體的例子。
假設(shè)有個平臺為用戶提供接送機服務(wù)劈愚。有X和Y兩個服務(wù)供應(yīng)商在服務(wù)瞳遍。這個平臺有DE2個渠道售賣這個服務(wù)。D渠道又分為D1菌羽、D2 掠械、D3 3個子渠道,現(xiàn)在在D1注祖、D2上下線了X供應(yīng)商猾蒂。一周后數(shù)據(jù)周報顯示D1、D2的訂單完成單減少是晨。需要PM給出解釋肚菠。
這里先解釋下,接送機服務(wù)用戶下單后罩缴,上車到達(dá)機場或目的地算訂單完成蚊逢。中間用戶沒有坐車层扶,比如用戶取消,或者沒有司機接單導(dǎo)致訂單取消烙荷,都算這個訂單沒有完成镜会。
初始推測的假設(shè)是D1D2下線X供應(yīng)商,導(dǎo)致Y供應(yīng)商下單增長终抽,但是沒有那么多司機接單稚叹,因而完成單減少。
那這個時候取數(shù)不能只去看D1D2下線前后訂單數(shù)拿诸、完成單數(shù)的變化。而是應(yīng)該把D3塞茅、整個D渠道亩码、E渠道和平臺渠道在前后的訂單數(shù)、完成單數(shù)都取一遍野瘦。萬一D3完成單也減少了呢描沟,可能就是渠道的原因。
取數(shù)范圍關(guān)注:
- 變化如何:比較D1D2的變化趨勢鞭光、變化比例
- 有變化和無變化的比較:D1D2 VS D3, D VS E
取數(shù)邏輯關(guān)注
- Y下單增長的渠道吏廉,完成單如何變化
- Y下單未增長甚至下降的渠道,完成單如何變化
- Y下單增長量大和小的渠道惰许,完成單如何變化
步驟二:從初始數(shù)據(jù)中建立一些假設(shè)
關(guān)鍵詞:假設(shè)
數(shù)據(jù)分析的核心是建立建設(shè)席覆、驗證假設(shè)。所以其實不需要多么高深的數(shù)學(xué)或統(tǒng)計學(xué)知識汹买,只要有最基本的假設(shè)檢驗的概念就可以了佩伤。
在步驟一中,你可能找到一些蛛絲馬跡似乎能論證結(jié)論晦毙。例如你發(fā)現(xiàn)了某個數(shù)據(jù)變化的同時結(jié)論數(shù)據(jù)也變化了生巡。但是要記住這個線索只是假設(shè),不要立刻當(dāng)成結(jié)論见妒。否則的話很可能會在后面被新出現(xiàn)的證據(jù)推翻孤荣。
在這一步中,把發(fā)現(xiàn)的線索當(dāng)作假設(shè)须揣,然后應(yīng)該思考怎么進(jìn)一步去論證盐股,需要哪些進(jìn)一步的數(shù)據(jù)。
步驟三:進(jìn)一步搜集數(shù)據(jù)返敬,論證假設(shè)
1 是自然下降/上升嗎遂庄?
出現(xiàn)數(shù)據(jù)問題,可以先評估是自然波動嗎劲赠?
假設(shè)步驟一中的案例涛目,渠道E中X供應(yīng)商在某個周末下單數(shù)增加秸谢。它的應(yīng)單率減少。應(yīng)單率指的是在用戶下的訂單中霹肝,司機接單的數(shù)量估蹄。
提出假設(shè):X下單數(shù)增加導(dǎo)致司機運力不足,從而應(yīng)單率減少沫换。
但首先可以評估下是否自然波動臭蚁。例如是否只要周末X的應(yīng)單率就會下降⊙渡停可以對比之前周末的數(shù)據(jù)垮兑。
2 有可能是整體性因素嗎?
排除了自然波動漱挎,看一下是否有整體性因素系枪?
例如那周末暴雨,導(dǎo)致航班變化磕谅、取消比較多私爷。因而訂單自動取消了。而這個因素不僅僅影響X供應(yīng)商膊夹,也會影響Y供應(yīng)商衬浑。那么可以看Y供應(yīng)商的應(yīng)單率是否也下降了。
3 是假設(shè)導(dǎo)致的嗎放刨?
排除了以上2種情況工秩,就要開始論證假設(shè)。假設(shè)論證一般是因果關(guān)系的論證进统。
1) 單一因果關(guān)系
即A導(dǎo)致B拓诸,這一論證除了去看出現(xiàn)A 是否出現(xiàn)B,還要看
- 出現(xiàn)A 是否有非B
- 未出現(xiàn)A是否一定是非B 是否有B
- 有B的情況是否一定是A麻昼,是否有非A
- 非B的情況是否有A奠支,是否是非A
例如,要論證A的增長引起了B的增長抚芦,通常需要看
- 有A增長時倍谜,B是否增長
- A不變或下降時,B是否不變或下降
- A增長幅度大或小時叉抡,B增長幅度是否大或小
- 以及反面的情況
如果只能看到A和B的數(shù)據(jù)尔崔,沒有非A或非B的數(shù)據(jù)怎么辦呢?
例如我們在接送機的列表頁新上了一個返現(xiàn)報價的產(chǎn)品褥民。但是購買返現(xiàn)產(chǎn)品的用戶比較少季春。由于返現(xiàn)產(chǎn)品原價高會被價格低的普通產(chǎn)品擠下去,導(dǎo)致有些情況用戶在第一屏看不到返現(xiàn)報價消返。我們推測返現(xiàn)整體露出少(A)所以效果差(B)载弄,但除了做AB測試再定義個邏輯耘拇,我們不可能找到整體返現(xiàn)露出多的情況。
這個時候宇攻,可以看子維度惫叛。
- 看子維度,且不要只看一個子維度逞刷,窮盡子維度是否能得出假設(shè)嘉涌。
- 看子維度的子維度】淝常看子維度是否能再分也能提供信息仑最。
不同車型(經(jīng)濟(jì)型、舒適型帆喇、豪華型等)都有返現(xiàn)词身。有些車型普通產(chǎn)品少,返現(xiàn)產(chǎn)品露出多番枚。返現(xiàn)露出多的車型效果是否更好?還有一個子維度是城市损敷。有些城市的普通產(chǎn)品也比其他城市少葫笼。不同城市的不同車型露出不同。該城市該車型露出多拗馒,該城市該車型是否效果好路星?等等.
2)因果鏈條
有時,一件事不能很直接找到原因诱桂,而是有一個長的因果鏈洋丐。那應(yīng)該找出因果鏈每一環(huán),定義測量指標(biāo)挥等,對每一環(huán)論證友绝。
例如步驟一里的案例實際是個因果鏈。
Y供應(yīng)商下單增長(指標(biāo):下單數(shù)) -> 導(dǎo)致司機運力不足(指標(biāo):應(yīng)單率=接單數(shù)/下單數(shù)) -> 接不起(指標(biāo):完成單率=完成單數(shù)/接單數(shù))
除了看下單數(shù)和完成單數(shù)肝劲,還要關(guān)注應(yīng)單率的變化迁客。
這一步驟中會有一個問題:有些數(shù)據(jù)比較難找。此時可以進(jìn)行估算辞槐。
例如評估產(chǎn)品露出對返現(xiàn)影響那個項目時掷漱,需要看不同城市的露出率。由于接送機需要用戶先輸入時間地址榄檬,再根據(jù)用戶選擇的區(qū)域展示該區(qū)域的產(chǎn)品卜范。有些區(qū)域有返現(xiàn)露出,有些沒有鹿榜。前端很難記錄多少概率下該城市返現(xiàn)是露出的海雪。
于是我就想锦爵,如果知道一個城市的熱門區(qū)域地址,將它們一個個輸入查看喳魏,記錄是否露出棉浸,不就能估算該城市的返現(xiàn)露出率了嗎?那怎么知道一個城市熱門區(qū)域有哪些呢刺彩?我打開攜程酒店迷郑,上面就有城市熱門區(qū)域嘛~接送機的客戶一般都是旅游或出差,所以酒店入住的熱門區(qū)域也差不多是接送機用戶地址的熱門區(qū)域创倔。
步驟四:得出結(jié)論
完美嗡害。