1.分析背景與目的
? ? ? ? 英國某在線零售電商主要以銷售各類禮品為主,很多客戶都是批發(fā)商。本案例利用該電商2010年12月1日—2011年12月9日的在線零售數(shù)據(jù)辟躏,構(gòu)建基于客戶價值分析的RFM模型君纫,對該電商客戶進(jìn)行分類驯遇,并對此結(jié)果進(jìn)行動態(tài)的客戶分析,為針對不同的客戶采取不同的運(yùn)營決策提供依據(jù)蓄髓。
2.分析思路
(1)分析指標(biāo)
(2)提出問題
① 如何構(gòu)建RFM模型以及并利用該模型進(jìn)行客戶群體分類叉庐?
②不同類型客戶數(shù)量的分布及貢獻(xiàn)價值情況?
3.數(shù)據(jù)理解與清洗
3.1 理解數(shù)據(jù)
(1)數(shù)據(jù)來源:數(shù)據(jù)集來自UCI加州大學(xué)歐文分校機(jī)器學(xué)習(xí)庫(UCI Machine Learning Repository: Online Retail Data Set)双吆。
(2)時間節(jié)點:2010年12月1日—2011年12月9日眨唬。
(3)數(shù)據(jù)大小:541909條數(shù)據(jù)好乐,8個字段匾竿。
(4)字段說明(理解字段在業(yè)務(wù)中所代表的的含義)
InvoiceNo:發(fā)票編號。為每筆訂單唯一分配的6位整數(shù)蔚万。若以字母'C'開頭岭妖,則表示該訂單被取消。
StockCode:產(chǎn)品代碼反璃。為每個產(chǎn)品唯一分配的編碼昵慌。
Description:產(chǎn)品描述。
Quantity:數(shù)量淮蜈。每筆訂單中各產(chǎn)品分別的數(shù)量斋攀。
InvoiceDate:發(fā)票日期和時間。每筆訂單發(fā)生的日期和時間梧田。
UnitPrice:單價淳蔼。單位產(chǎn)品價格,單位為英鎊裁眯。
CustomerID:客戶編號鹉梨。為每個客戶唯一分配的5位整數(shù)。
Country:國家穿稳〈嬖恚客戶所在國家/地區(qū)的名稱。清洗數(shù)據(jù)
3.2數(shù)據(jù)清洗
數(shù)據(jù)清洗部分思路如下:
3.2.1 選擇字段和重命名字段
①刪除Description逢艘、Country字段旦袋,因為本次分析不涉及該字段數(shù)據(jù)。
②增加每筆訂單中每件商品的總價字段TotalPrice埋虹,TotalPrice=UnitPrice*Quantity猜憎,即數(shù)據(jù)每一行列出的是某種商品的購買數(shù)量和商品單價。
③Invoicedate中的時間包含了年月日和時分秒搔课,將兩者通過分列功能分開胰柑,分別用Date和Time表示截亦。
3.2.2 刪除重復(fù)值
因為該數(shù)據(jù)中,每一行并不代表一個獨(dú)立訂單柬讨,而是代表訂單中的某種商品的銷售情況(數(shù)量及單價等),該電商平臺是否會自動合并同一訂單里的相同商品不得而知崩瓤。我們規(guī)定,若所有字段的值都完全相同踩官,則視為重復(fù)數(shù)據(jù)却桶,僅保留一條。經(jīng)過查重蔗牡,刪除重復(fù)值5268條颖系。
3.2.3 缺失值處理
CustomerID存在缺失值135080條,數(shù)據(jù)都很大辩越,不可能全部刪除嘁扼。在實際工作中CustomerID這樣的數(shù)據(jù)缺失,首先找業(yè)務(wù)部門或者數(shù)據(jù)來源部門確認(rèn)補(bǔ)上信息黔攒。那么在這里無法找到相關(guān)人員確認(rèn)趁啸,暫且把處于缺失狀態(tài)的值替換為0(null值替換為0)
3.2.4 一致化處理
將Date字段設(shè)置為日期格式,其他為常規(guī)格式督惰。
3.2.5 異常值處理
①檢查日期是否在規(guī)定時間范圍內(nèi)(2010年12月1日到2011年12月9日)不傅。
? ? 結(jié)果顯示,所有日期都在規(guī)定范圍內(nèi)赏胚,屬于正常數(shù)據(jù)访娶。
②檢查單價和數(shù)量是否存在異常值,如負(fù)值觉阅,零值震肮。
? 檢查發(fā)現(xiàn),數(shù)量出現(xiàn)了負(fù)值留拾,單價出現(xiàn)了0值和負(fù)值,把它們?nèi)縿h除鲫尊。
③發(fā)票編號InvoiceNo是否含有“C”訂單痴柔。
? ? 前面字段開頭有說明,發(fā)票編號InvoiceNo含有C字頭的是取消訂單疫向,故全部刪除咳蔚。
4.構(gòu)建RFM模型及客戶分類
4.1 構(gòu)建RFM模型
4.1.1 構(gòu)建RFM模型指標(biāo)
RFM模型是衡量客戶價值和創(chuàng)利能力的重要手段和工具。通過研究客戶近期的購買行為搔驼、購買頻率以及購買金額來判定客戶谈火,從而可以實現(xiàn)對客戶精細(xì)化劃分。
本次分析采用RFM模型分析客戶舌涨。RFM模型需要知道每位客戶最近的一次消費(fèi)時間(這里以2011/12/09為參考時間)糯耍,時間范圍內(nèi)的消費(fèi)頻率和總交易金額。接下來我們要做的就是把這些查詢出來,以供后面分析温技。一個發(fā)票單號是一個訂單革为。
4.1.2創(chuàng)建新表RFM
下面需要求出與上述三個相關(guān)的衡量指標(biāo),即天數(shù)差R舵鳞、消費(fèi)頻率F、消費(fèi)金額M及創(chuàng)建新表RFM。
(1)天數(shù)差R計算
利用排序功能和Countif()函數(shù)將每位顧客最后一次消費(fèi)時間篩選出來鹰晨,相差天數(shù)就等于2011/12/9減去最后一次消費(fèi)時間苗膝。
(2)消費(fèi)頻率F、消費(fèi)金額M計算
第一次消費(fèi)時間和最近一次消費(fèi)時間之間的時間段內(nèi)套才,消費(fèi)的次數(shù)(F)和接金額(M)
(3)RFM表
4.1.3? R迂猴、F、M評分
(1)R霜旧、F错忱、M評分標(biāo)準(zhǔn)
R值分段得分F值分級得分M值分段得分
依照評分表掷倔,利用“IF函數(shù)嵌套”計算出各用戶對應(yīng)的RFM得分:
R=IF(D2<=30,5,IF(D2<=90,4,IF(D2<=180,3,IF(D2<=365,2,1))))
F=IF(E2<=5,1,IF(E2<=10,2,IF(E2<=20,3,IF(E2<=80,4,5))))
M=IF(F2<=500,1,IF(F2<=1000,2,IF(F2<=5000,3,IF(F2<=10000,4,5))))
4.1.4 創(chuàng)建RFM值表
在計算RFM值時,通常將與RFM評分的平均值作對比个绍,首先利用Average()函數(shù)求出三者的均值勒葱。
根據(jù)上述求得的均值,利用“IF函數(shù)”將R巴柿、F凛虽、M評分與其對比,我們以“1”表示得分高于平均分广恢,以“0”表示得分不高于平均分凯旋,依次對RFM值進(jìn)行計算,得到如下結(jié)果:
4.2 利用RFM模型進(jìn)行客戶分類
客戶分類標(biāo)準(zhǔn)
客戶分類方法
用CONCATENATE()函數(shù)函數(shù)將所有客戶的R钉迷、F至非、M值連接起來,然后將客戶類型對應(yīng)的值R糠聪、F荒椭、M值也連接起來。
最后用VLOOKUP()進(jìn)行匹配即可達(dá)到對客戶進(jìn)行分類的效果舰蟆。
5. 可視化分析
對基于RFM模型的客戶分類結(jié)果進(jìn)行分析趣惠,了解不同類型客戶的數(shù)量分布情況及貢獻(xiàn)價值情況狸棍。
5.1 不同類型客戶數(shù)量的分布情況
對得到的各類型客戶的總數(shù)和各類型客戶的客戶占比情況,分別用柱形圖和餅圖表示信卡。
從該電商客戶數(shù)量上分析隔缀,重要深耕客戶最多,占到了38.47%傍菇;其次是重要挽留客戶猾瘸,占比是19.11%;重要價值客戶排在前三位丢习,為17.59%牵触。
5.2 客戶貢獻(xiàn)價值分析
通過客戶貢獻(xiàn)價值分析(各類型客戶貢獻(xiàn)銷售額與所有客戶貢獻(xiàn)銷售額的比值)來衡量其貢獻(xiàn)價值。
通過圖形可以看出咐低,雖然重要深耕客戶的數(shù)量最多揽思,但是重要價值客戶的銷售額貢獻(xiàn)率最高,17%的重要客戶貢獻(xiàn)62%的交易額见擦,符合二八法則钉汗。
6 結(jié)論與建議
結(jié)論:該電商客戶根據(jù)RFM模型可分為8個類型,重要深耕客戶鲤屡、重要挽留客戶和重要價值客戶排在前三位损痰,是該電商的主要客戶類型。銷售額主要依賴于重要價值客戶酒来,占總銷售額的62%卢未;其次是重要深耕客戶,占總銷售額的24%堰汉。
建議:針對不同類型客戶人群應(yīng)該制定針對性策略辽社,從而刺激進(jìn)一步的客戶消費(fèi)。
①對于重要價值客戶翘鸭,要積極溝通滴铅,重視他們的需求,可以適當(dāng)給予店鋪VIP資格就乓,建立客戶忠誠度失息,牢牢抓住這類客戶。
②重要深耕客戶數(shù)量最多档址,且銷售額貢獻(xiàn)也排第二,銷售人員應(yīng)該努力跟進(jìn)這些用戶邻梆,促進(jìn)這些用戶轉(zhuǎn)換為“重要價值客戶”守伸。
③重要挽留客戶人數(shù)排第二位,針對這部分客戶浦妄,應(yīng)該重點聯(lián)系或拜訪尼摹,提高留存率见芹。
④后續(xù)幾類客戶可采取適當(dāng)性策略,有選擇性的維護(hù)蠢涝。