一、現實與Kaggle的區(qū)別
現實環(huán)境的數據分析工作和Kaggle題目之間缘屹,最大的區(qū)別在于Kaggle上的問題往往非常清晰凛剥。
預測類問題,你只需要把預測做的足夠準確就能拿高分轻姿。
但在實際的業(yè)務環(huán)境中犁珠,你做了一個很牛逼的預測模型傅瞻,換回來的只是業(yè)務方一句“這個有什么用?”
有時候業(yè)務方提出的問題也很不靠譜盲憎,提需求的時候說是要分析一個問題的原因嗅骄,結果實際上問題根本就不存在,只是對方的感覺饼疙。
所以如果你在Kaggle上可以混的風生水起溺森,那么只能說你對于確定性問題的解題方法掌握比較好。
但到了實際業(yè)務環(huán)境下窑眯,識別問題成了一個更重要的能力屏积。
業(yè)務人員提的數據分析需求往往很雜,各種千奇百怪的“是不是磅甩、有多少炊林、為什么、能不能卷要、會不會渣聚,怎么辦”等問題層出不窮。
到底哪些問題可以歸為一類僧叉?這類問題又該如何分析奕枝?這是每個數據分析師都想知道的。
我根據自己的經驗和理解瓶堕,整理了一套定義問題的方法隘道,分享給大家。
二郎笆、一個業(yè)務分析需求的必備要素有哪些谭梗?
一個業(yè)務分析需求,必備的要素有哪些宛蚓?
上一篇提到了一個思考框架激捏,業(yè)務流、管理流與數據流苍息。
這里簡單復習一下缩幸,一般常見的分析流程:
1. 是什么
用數據流反應管理流壹置,解決“是什么”的問題竞思。留存率是多少,算高算低钞护?如果留存率低的話是哪類用戶低盖喷?
我一般把常見的細分分析得出的結論,都歸納成“是什么”难咕。
“為什么購買轉化率低课梳?”距辆,“因為落地頁的轉化率低”。
類似這樣的回答暮刃,其實只是對轉化率做了細分跨算,本質上還是“是什么”。
真正的“為什么”是“為什么落地頁的轉化率低椭懊?用戶到底在想什么诸蚕?需求是什么?”
2. 為什么
用數據流反應業(yè)務流氧猬,解決“為什么”的問題背犯。
什么原因造成一部分用戶的留存率低?是因為需求無法滿足盅抚?還是非目標用戶群體漠魏?
如果是落地頁轉化問題,那么現在落地頁上的問題是什么妄均?哪些元素降低了轉化率柱锹?
這類問題的答案要落實到具體的用戶需求上。
有時候數據可以反應用戶的實際使用情況丰包,比如用戶在落地頁上停留較長奕纫,也愿意查看活動規(guī)則,但是轉化率很低烫沙。
那么這種情況大概率是用戶被賣點吸引匹层,但是看不懂規(guī)則,或者實際活動與他的理解不一致锌蓄。
很多情況下升筏,數據沒法直接反應用戶遇到的問題,必須通過用戶調研實現瘸爽。
3. 怎么辦
在管理流中找對策解決業(yè)務流的問題您访,解決“怎么辦”的問題。
如果是需求無法滿足這部分用戶剪决,那么我們可以怎么解決這個問題灵汪?增加功能還是優(yōu)化現有功能的體驗?
有時候柑潦,這一步并不一定是數據分析師來做的享言,甚至不是從數據上推導的;上一步的“為什么”如果已經找到非常具體的原因渗鬼,比如“A類用戶流失主要是由于會員到期”览露,那業(yè)務方圍繞著如何促進續(xù)費就能改善這一狀況。
4. 目的
除了分析的常見流程譬胎,還有一個分析的前提——這次分析的目的是什么差牛。
這個目的往往是改善某一個具體的指標命锄。
我雖然經常吐槽業(yè)務人員沒有數據驅動業(yè)務的思維,但是在KPI問題上偏化,業(yè)務人員對數據思維往往非常好脐恩;如果做的事情沒辦法用數據衡量,對業(yè)務人員來說價值不大侦讨。
所以被盈,一般來說,一個數據分析需求一共要經過四個階段:
目的:確定分析的目的搭伤,優(yōu)化什么指標只怎。
是什么:確認現在的指標情況“是什么”,問題集中在哪個部分怜俐?
為什么:現狀為什么是這樣身堡,用戶的需求是什么?
怎么辦:制定什么樣的對策來優(yōu)化指標拍鲤。
三贴谎、常規(guī)的數據分析問題類型
最常規(guī)的問題類型,是業(yè)務方知道前面N個環(huán)節(jié)季稳,需要分析后面的環(huán)節(jié)擅这。
比如最常規(guī)的,只知道目的景鼠,后續(xù)都需要分析仲翎。
用戶運營找到數據分析師,想要做一個專題分析铛漓,主題是如何提升用戶的活躍率溯香。
這個問題的目的很明確——“提升用戶活躍率”。
但是后面的部分就沒那么清楚了浓恶,數據分析師可以按照之前提到的四個步驟一步一步地向后推進玫坛。
首先要做的是“是什么”,把現有的用戶活躍率的數據提取出來包晰,看一下目前的數據表現如何湿镀。
如果數據表現確實不太理想,那么再看看到底是整體都低伐憾,還是有部分群體特別低勉痴。
之后是“為什么”的階段。如果有部分群體活躍率特別低塞耕,那么這部分用戶為什么活躍率低蚀腿?他們的需求是什么?
最后扫外,針對新用戶的問題莉钙,制定對應的業(yè)務動作;如果發(fā)現這部分群體只使用一些基礎功能筛谚,那么如何引導他們使用高級的功能磁玉?
這樣一個完整的分析基本就完成了。
其中的具體分析細節(jié)本篇暫時不討論驾讲,放到下一篇再講蚊伞,這篇主要講一下整個分析思路的框架。
這類問題是知道前面N個環(huán)節(jié)吮铭,分析過程都是類似的时迫,向后分析即可。
四谓晌、驗證猜想型需求
其他的數據分析問題掠拳,可以用一個表來歸納。
大體分為兩類纸肉,一類是有目標的溺欧,一類是沒目標的。
有目標的柏肪,一般是驗證猜想姐刁。
比如,知道“目的”和“為什么”烦味。
業(yè)務方想提升新功能的使用率聂使,提出一個猜想。
新上的功能對于新用戶來說理解成本比較高谬俄,想做一些優(yōu)化岩遗。
但這只是一個猜想,甚至連問題本身是否存在都不確定凤瘦。
這類問題需要把缺失的“是什么”補上宿礁,
1)是什么:用數據證明新用戶現有的使用率怎么樣,如果新用戶使用率已經較高蔬芥,那么這個猜想的基礎就不存在了梆靖。
如果新用戶使用率確實比較低,那么再驗證新功能是不是理解成本太高笔诵。
2)怎么辦:驗證了猜想返吻,再思考怎么辦。
還有知道“目的”和“怎么辦”的乎婿。
業(yè)務方想要提升用戶數量测僵,然后看到拼多多的微信裂變拉新搞的很成功,我們拉新是不是也可以微信裂變提升新用戶數呢?
需要做的步驟:
“是什么”:看一下目前的新用戶數捍靠。也許現在的新用戶數已經還不錯了沐旨,那是不是還有必要花人力去優(yōu)化拉新環(huán)節(jié)?
“為什么”:如果現在的用戶數上不去榨婆,為什么整體用戶數上不去磁携?如果因為新用戶的留存和轉化很差,新用戶沒幾個能留下來良风,那么工作的重點應該是提升留存谊迄,而不是拉新。
得出結論:不應該采用裂變拉新烟央,原因是我們的業(yè)務場景和拼多多不同统诺,我們現在無法承接新用戶的轉化,需要優(yōu)化產品體驗后再做會更好疑俭。
五粮呢、無目標的需求
沒目標的,這類就比較坑了怠硼;只知道”為什么“這種問題往往是有一些客戶的反饋鬼贱,比如用戶反饋一個常用的功能經常找不到入口在哪。
這個反饋比數據分析的結論要準確多了香璃,數據分析最多知道一類人的使用特點是什么这难,基本不可能知道用戶到底在想什么。
產品經理拿到這種反饋葡秒,需求背景寫起來都理直氣壯了姻乓,這可是客戶的的真實需求。
分析這種問題眯牧,首先得確定目標蹋岩;如果優(yōu)化這個功能的入口,到底要優(yōu)化哪個指標学少?是做用戶留存率剪个,還是功能轉化率?如果是為了優(yōu)化用戶留存率版确,那現在留存率是多少扣囊?這個反饋的用戶的留存情況怎么樣?會不會這個用戶是一個重度用戶绒疗,留存情況非常好侵歇。
而常用這類功能的用戶都是重度用戶,優(yōu)不優(yōu)化這群用戶都會留下來吓蘑;那這種反饋優(yōu)先級肯定比較低惕虑。
而如果目標是提高功能轉化率,那么看一下目前這個功能的點擊率,看一下是普遍問題還是這個用戶的個別問題溃蔫;之后再按順序繼續(xù)分析即可健提。還有一類沒目標的需求更坑。
業(yè)務方看到競品在搞降價促銷活動酒唉,于是提示“我們是不是也可以搞一個降價促銷矩桂?”
這類需求根本沒考慮清楚搞一個這樣的活動目的是什么沸移,是提升銷量嗎痪伦?
也許競品搞這個活動的目的是清庫存,降低庫存成本雹锣;而你根本沒有庫存壓力网沾,直接照抄最后庫存也沒清掉,銷售額提升也不明顯蕊爵;如何分析就不贅述了辉哥。
六、總結
日常的分析需求一般不會超過上述這個分析框架攒射,拿到分析需求的時候思考一下這個需求目前擁有的要素醋旦,然后從左到右推導,可以快速組織分析思路会放。
至于每一個環(huán)節(jié)的具體做法饲齐,歡迎關注,等下一篇詳細說說咧最。
歡迎關注“三元方差”公眾號捂人。