探索式分析,主要是運(yùn)用一些分析方法從大量的數(shù)據(jù)中發(fā)現(xiàn)未知且有價(jià)值信息的過(guò)程叙身。對(duì)于初步探索性分析而言,數(shù)據(jù)可視化是一個(gè)非常便捷硫狞、快速信轿、有效的方法,你可以使用作圖残吩、制表等方法來(lái)發(fā)現(xiàn)數(shù)據(jù)的分布特征财忽,然后可以使用一些統(tǒng)計(jì)分析方法更深入地發(fā)現(xiàn)數(shù)據(jù)背后的信息。常用的探索性分析方法包括RFM分析泣侮、聚類分析即彪、因子分析、對(duì)應(yīng)分析等活尊。
RFM分析
應(yīng)用背景:
在產(chǎn)品迭代過(guò)程中隶校,通常需要根據(jù)用戶的屬性進(jìn)行歸類,也就是通過(guò)分析數(shù)據(jù)蛹锰,對(duì)用戶進(jìn)行歸類深胳,以便于在推送及轉(zhuǎn)化過(guò)程中獲得更大的收益。
分析方法:
RFM分析(Recency铜犬,F(xiàn)requency舞终,Monetary)
分析工具:
SPSS(數(shù)據(jù)分析的重量級(jí)應(yīng)用,與SAS二選一)
一.RFM基礎(chǔ)知識(shí)
所謂探索性分析癣猾,主要是運(yùn)用一些分析方法從大量的數(shù)據(jù)中發(fā)現(xiàn)未知且具有價(jià)值信息的過(guò)程敛劝。
常用的探索性分析方法包括:RFM分析、聚類分析纷宇、因子分析夸盟、對(duì)應(yīng)分析等。
RFM的含義:
R(Recency):客戶最近一次交易時(shí)間的間隔像捶。R值越大上陕,表示客戶交易發(fā)生的日期越久,反之則表示客戶交易發(fā)生的日期越近作岖。
F(Frequency):客戶在最近一段時(shí)間內(nèi)交易的次數(shù)唆垃。F值越大五芝,表示客戶交易越頻繁痘儡,反之則表示客戶交易不夠活躍。
M(Monetary):客戶在最近一段時(shí)間內(nèi)交易的金額枢步。M值越大沉删,表示客戶價(jià)值越高渐尿,反之則表示客戶價(jià)值越低。
RFM分析就是根據(jù)客戶活躍程度和交易金額的貢獻(xiàn)矾瑰,進(jìn)行客戶價(jià)值細(xì)分的一種方法砖茸。
RS:基于最近一次交易日期計(jì)算的得分,距離當(dāng)前日期越近殴穴,得分越高凉夯。例如5分制。
FS:基于交易頻率計(jì)算的得分采幌,交易頻率越高劲够,得分越高。如5分制休傍。
MS:基于交易金額計(jì)算的得分征绎,交易金額越高,得分越高磨取。如5分制人柿。
RFM總分值:RFM=RS*100+FS*10+MS*1
RFM分析的主要作用:
識(shí)別優(yōu)質(zhì)客戶∶ρ幔可以指定個(gè)性化的溝通和營(yíng)銷服務(wù)凫岖,為更多的營(yíng)銷決策提供有力支持。
能夠衡量客戶價(jià)值和客戶利潤(rùn)創(chuàng)收能力逢净。
RFM的假設(shè)前提:
假設(shè)交易的可能性:
最近交易過(guò)的客戶 > 最近沒有交易過(guò)的
交易頻率高的客戶 > 交易頻率低的
交易金額大的客戶 > 交易金額小的
二.分析實(shí)踐
RFM接受的數(shù)據(jù)格式有兩種:
交易數(shù)據(jù):每次交易占用一行隘截,關(guān)鍵變量是客戶ID、交易時(shí)間汹胃、交易金額婶芭。
客戶數(shù)據(jù):每次交易占用一行,關(guān)鍵變量是客戶ID着饥、交易總金額犀农、最近交易日期、交易總次數(shù)宰掉。
我們通常采用交易數(shù)據(jù)的格式進(jìn)行分析呵哨。因?yàn)榻灰讛?shù)據(jù)可以整理成客戶數(shù)據(jù),而客戶數(shù)據(jù)無(wú)法還原成交易數(shù)據(jù)轨奄。即用交易數(shù)據(jù)的字段可以得到客戶數(shù)據(jù)的字段孟害,反之不行。
具體是“交易數(shù)據(jù)”還是“客戶數(shù)據(jù)”根據(jù)數(shù)據(jù)源文件的格式而定挪拟。
變量:選擇各個(gè)變量挨务。
分箱化:評(píng)分的總分是多少。
保存:生成哪些新的變量,可以自定義名稱谎柄。
輸出:可以全部勾選丁侄,為了能全面的解讀RFM分析結(jié)果。
確定后朝巫,生成了四個(gè)新的變量:
嶄新-得分:最后一次交易的時(shí)間間隔得分鸿摇;
頻率-得分:交易總次數(shù)得分;
消費(fèi)金額-得分:交易總金額得分劈猿;
RFM得分:RFM得分
三.結(jié)果解讀(最重要的環(huán)節(jié))
該圖主要用來(lái)查看每個(gè)RFM匯總得分的客戶數(shù)量分布是否均勻拙吉。
我們期望均勻的分布,若不均分揪荣,則應(yīng)該重新考慮RFM的適用性或嘗試另一種分箱方法(減少分箱數(shù)目或隨機(jī)分配綁定值)庐镐。
“RFM熱圖”是交易金額均值在RS和FS繪制的矩陣圖上的圖形化表示,用顏色深淺表示交易金額均值的大小变逃,顏色越深必逆,表示相應(yīng)矩陣塊內(nèi)的客戶交易金額均值越高。
如本例隨著RS和FS的分值增大揽乱,顏色越來(lái)越深名眉,說(shuō)明客戶最近一次交易時(shí)間越近、交易次數(shù)越多凰棉,其平均交易金額越高损拢。
該圖是最后一次交易時(shí)間、交易總次數(shù)撒犀、交易總金額之間的散點(diǎn)圖福压。
通過(guò)散點(diǎn)圖可以清晰直觀的看到三個(gè)分析指標(biāo)兩兩之間的關(guān)系,便于指標(biāo)相關(guān)性評(píng)估或舞。
本例中荆姆,交易總次數(shù)和交易總金額存在較為明顯的線性關(guān)系,而最后一次交易時(shí)間和另外兩個(gè)分析指標(biāo)之間的相關(guān)性較弱映凳。
四.RFM分析應(yīng)用
為客戶分組胆筒,即將三個(gè)指標(biāo)分別分為“高”和“低”兩種,高于均值的為“高”诈豌,低于均值的為“低”仆救。
因此有三件事要做:
計(jì)算出各個(gè)指標(biāo)得分的平均值;
將各個(gè)變量高于平均分的定義為“高”矫渔,低于平均分的定義為“低”彤蔽;
根據(jù)三個(gè)變量“高”“低”的組合來(lái)定義客戶類型;如“高”“高”“高”為高價(jià)值客戶庙洼。
第一步顿痪,先計(jì)算各個(gè)指標(biāo)的平均值镊辕。
一定要勾選平均值,否則輸出結(jié)果中沒有“平均值”员魏。
現(xiàn)在我們得到了各個(gè)變量的平均分:3.33,2.99叠聋,3.01撕阎。
第二步,將各個(gè)變量高于平均分值的定義為“高”碌补,否則為“低”虏束。
按照1-2-3-4-5的步驟設(shè)置高于平均值的為“2”,也可以設(shè)置為“高”
同理去設(shè)置FS和MS厦章。
設(shè)置后結(jié)果如下:
可以在變量設(shè)置里設(shè)置標(biāo)簽镇匀,1代表“低”,2代表“高”袜啃,也可以在“重新編碼到不同變量”里面設(shè)置時(shí)就直接定義為“高低”汗侵,而不是“1和2”。
第三步:通過(guò)各個(gè)變量的高低組合群发,確定客戶類型晰韵。
第三區(qū)域:可以是公式,也可以是具體的數(shù)字熟妓,其實(shí)這里就是輸出結(jié)果雪猪。
第四區(qū)域:表示滿足的條件。
同理在“變量設(shè)置”里對(duì)標(biāo)簽就行設(shè)置就行起愈。
最終分析結(jié)果如下:
通過(guò)RFM方法只恨,我們根據(jù)用戶的屬性數(shù)據(jù)分析,對(duì)用戶進(jìn)行了歸類抬虽。在推送官觅、轉(zhuǎn)化等很多過(guò)程中,可以更加精準(zhǔn)化阐污,不至于出現(xiàn)用戶反感的情景缰猴,更重要的是,對(duì)產(chǎn)品轉(zhuǎn)化等商業(yè)價(jià)值也有很大的幫助疤剑。