你真的能分析出你的用戶嗎?
數(shù)據(jù)分析的一個常見應(yīng)用是將網(wǎng)站的用戶特征發(fā)現(xiàn)出來封拧,以期待更好的服務(wù)用戶志鹃。但是真的將用戶全部得到之后,會發(fā)現(xiàn)即便計算平均年齡都是一個問題泽西,很可能更大量的用戶是沒有設(shè)置年齡或者明顯錯誤的數(shù)據(jù)曹铃。一個可能的解決方法是計算有設(shè)置年齡的平均值,并不意味著這個值可以用來分析用戶捧杉,因為這里依賴的一個假設(shè)很明顯并不成立:填寫年齡的用戶的年齡分布與填寫錯誤或者不填寫的用戶年齡分布一致陕见。
即便真的得到了年齡的平均值也說明不了任何問題,由于沒有比較對象味抖,粗暴的說我們網(wǎng)站用戶更加年輕是不成立的评甜,很可能只是因為你成立的比較晚而已。而更重要的是非竿,個體之間的差異遠遠大于種群之間的差異蜕着,這導(dǎo)致通過一兩個數(shù)值是沒有辦法對用戶群體進行畫像的谋竖。比如說美國大選红柱,大家就想到教育良好、大城市蓖乘、移民選民主黨锤悄,紅脖子、工人農(nóng)民嘉抒、傳統(tǒng)行業(yè)選共和黨零聚。這作為一個平均值的差異是毫無疑問的,但兩個群體內(nèi)部的差異很明顯遠大于群體之間的差異些侍。
數(shù)據(jù)分析的一個方法是通過高維度切片的方式來進行更細致的畫像和分類隶症,然后作為老板會得到一個分析的非常好的報表,多少人然而這帶來的問題是大量的用戶會被多個群組所定義岗宣。
你真的能確認因果關(guān)系嗎蚂会?
可能用戶比較復(fù)雜,但是至少我們可以通過數(shù)據(jù)分析一下哪個功能帶了更多的新用戶吧耗式。假定現(xiàn)在有一個線下的活動來吸引用戶胁住,上帝視角告訴我們效果不錯趁猴,增長了5%的注冊用戶。那么問題來了彪见,怎么在一個日變化超過10%儡司,工作日和周末變化超過30%的曲線圖里看到這個變化呢?這樣子的線下活動由于是一次性的余指,通常很難在圖表中直觀顯示捕犬,特別是線下活動很難添加追蹤記號來判定用戶來源。
當有第二個市場團隊做了另外一個線上活動浪规,這個問題就變得更加復(fù)雜了或听。假設(shè)這個市場團隊放出了廣告吸引了更多用戶來訪問,出現(xiàn)了50%的訪問增長笋婿,而這些很可能有相當一部分來自于線下注冊用戶剛開手機時誉裆,看到的一些內(nèi)容而刺激的增長。當兩個活動產(chǎn)生相關(guān)性的時候缸濒,因果關(guān)系就很難判斷得到足丢。
你的分析真的能夠很好的了解情況嗎?
在我之前團隊里庇配,最臭名昭著的就是數(shù)據(jù)報表的監(jiān)控斩跌,如果指標出現(xiàn)了超過30%的變動,就會觸發(fā)警報捞慌,然后分析師需要搞清楚原因耀鸦。于是,上百個報表每周觸發(fā)數(shù)十個警報啸澡,幾乎沒有一個能夠找到原因的袖订,過上兩三周就恢復(fù)了正常。有的也能找到原因嗅虏,但通常無法歸結(jié)到數(shù)據(jù)分析所期待的宏觀原因上洛姑,常見的原因有:某個按鈕變動了位置,某個按鈕的Logging換了標簽皮服,產(chǎn)品代碼里出了Bug楞艾,數(shù)據(jù)分析代碼里出了Bug。很多這種變化實際上是產(chǎn)品部門自己可以預(yù)期的龄广,而數(shù)據(jù)分析卻是后知者硫眯,花費大量的精力得到了一個別人已經(jīng)知道的結(jié)論。比較有效的一種數(shù)據(jù)分析可能是择同,伴隨某新品發(fā)售帶來的客戶增長两入,這個可以被量化出來,但請注意這個代價奠衔。
而真正的問題谆刨,影響長遠的分析塘娶,通常都是通過長期的趨勢來體現(xiàn)出來的,很難是某天突然警報響了就可以得到答案的痊夭。真正有價值的分析刁岸,是分析你這個App為什么打不過競爭對手,然后通過若干指標來推出結(jié)論她我;或者是分析app現(xiàn)在的狀況虹曙,可能的增長點。沉迷于若干指標很難得到有價值的信息番舆。你的目的終究是讓你的應(yīng)用產(chǎn)生價值酝碳,而不是產(chǎn)生更多DAU,盡管這可能是實現(xiàn)價值的一個途徑恨狈。
你的分析真的能夠幫助決策嗎疏哗?
很多時候的決策是試圖用數(shù)據(jù)來證明決策的正確性,而不是用數(shù)據(jù)來產(chǎn)生決策禾怠,這也是數(shù)據(jù)分析師期望和實際的差別返奉。這個主要原因是,所謂的數(shù)據(jù)驅(qū)動吗氏,并沒有一個規(guī)定的范式芽偏,原本期待的是基于事實得到結(jié)論,但由于每個人主觀性和多維度事實的客觀性弦讽,這個事實的描述都是非常困難的污尉,所以最終變成了,得到一個結(jié)論并進行數(shù)據(jù)支撐往产。
有一些決策是通過A/B測試來進行的被碗,比如拿不定是XYZ中某個決策,通過在線測試來選擇其中一個效果最好的捂齐。這是真正能幫助決策的分析蛮放,但局限通常在是選擇橘子還是蘋果缩抡,而不是橘子還是電動車奠宜。