數(shù)據(jù)分析方法一般有常規(guī)分析、統(tǒng)計(jì)模型分析陌兑、自建模型分析沈跨。這三種分析思路,基本能解決大部分分析需求兔综,并根據(jù)分析需求固化為數(shù)據(jù)產(chǎn)品饿凛。
- 常規(guī)分析
常規(guī)分析經(jīng)常會用到同環(huán)比分析法和ABC分析法,即分析對比趨勢和分析占比情況软驰。
同環(huán)比分析應(yīng)用到數(shù)據(jù)產(chǎn)品中常見的有業(yè)務(wù)周涧窒、月、日報等锭亏,例如纠吴,拿很多互聯(lián)網(wǎng)公司都關(guān)注的核心指標(biāo)DAU(日活躍用戶數(shù)),周報里一般都會對比DAU的周環(huán)比變化慧瘤,如果上漲或者下跌的比較大的話戴已,就要進(jìn)一步查找分析業(yè)務(wù)原因。
- 同比:某個周期的時段與上一個周期的相同時段比較锅减,如今年的6月比去年的月糖儡,本周的周一比上周的周一等等。同比增長率=(本期數(shù)-同期數(shù))/同期數(shù)×100%怔匣。
- 環(huán)比:某個時段與其上一個時長相等的時段做比較握联,比如本周環(huán)比上周等等。環(huán)比增長率=(本期數(shù)-上期數(shù))/上期數(shù)×100%每瞒。
-
ABC分析法:一般是以某一指標(biāo)為對象金闽,進(jìn)行數(shù)量分析,以該指標(biāo)各維度數(shù)據(jù)與總體數(shù)據(jù)的比重為依據(jù)剿骨,按照比例大小順序排列呐矾,并按照一定的比重或累計(jì)比重標(biāo)準(zhǔn),將各組成部分分為ABC三類懦砂。
- 統(tǒng)計(jì)模型分析
當(dāng)掌握了很大的數(shù)據(jù)量蜒犯,希望在數(shù)據(jù)中挖掘出更多信息的時候,一般都可以應(yīng)用成熟的模型進(jìn)行比較深入的分析荞膘,例如罚随,經(jīng)常會面對如下的業(yè)務(wù)場景:
- 預(yù)測產(chǎn)品在未來一年內(nèi)的日活用戶數(shù)會按什么趨勢發(fā)展,預(yù)估DAU羽资;
- 上線了某個營銷活動淘菩,預(yù)估活動效果怎么樣,用戶參與度情況;
- 對現(xiàn)有用戶進(jìn)行細(xì)分潮改,到底哪一類用戶才是目標(biāo)用戶群狭郑;
- 一些用戶購買了很多商品后,哪些商品同時被購買的幾率高汇在。
1)回歸分析:可以理解成幾個自變量通過加減乘除或者比較復(fù)雜的運(yùn)算得出因變量『踩現(xiàn)在常用的回歸分析主要有線性和非線性回歸、時間序列等糕殉。
2)聚類分析:細(xì)分市場亩鬼、細(xì)分用戶群里都屬于聚類問題,這樣更方便了解用戶的具體特征阿蝶,從而針對性的做一些營銷等雳锋,常見的聚類分析一般有K均值聚類、分布估計(jì)聚類等羡洁。
關(guān)于聚類分析玷过,最常用的就是對用戶進(jìn)行分類,首先筑煮,要選取聚類變量冶匹,要盡量使用對產(chǎn)品使用行為有影響的變量,但是還是要注意這些變量要在不同研究對象上有明顯差異咆瘟,這些變量之間又不存在高度相關(guān)嚼隘,例如,年齡袒餐、性別飞蛹、學(xué)歷等。然后灸眼,把變量對應(yīng)的數(shù)據(jù)輸入到模型中卧檐,選擇一個合適的分類數(shù)目,一般會選拐點(diǎn)附近的幾個類別作為分類數(shù)目焰宣,如下圖3霉囚。接下來,要觀察各類別用戶在各變量上的表現(xiàn)匕积,找出不同類別用戶區(qū)別去其他用戶的重要特征盈罐,選取最明顯的幾個特征,最后進(jìn)行聚類處理闪唆。
3)關(guān)聯(lián)分析:做關(guān)聯(lián)分析一般要理解頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則兩個概念盅粪,頻繁項(xiàng)集是經(jīng)常出現(xiàn)在一塊兒的物品的集合,關(guān)聯(lián)規(guī)則暗示兩種物品之間可能存在很強(qiáng)的關(guān)系悄蕾。
- 自建模型分析
當(dāng)以上兩種分析方法都不能滿足業(yè)務(wù)的分析需求時票顾,這時候就需要自建模型進(jìn)行分析。