目的
信息時代使得企業(yè)的營銷焦點從產品中心轉變?yōu)橛脩糁行穆溃S系“客戶關系”成為企業(yè)核心問題菠红。而這個核心問題最大的痛點:用戶分類【20/80法則: 往往20%的核心用戶承擔著整個貢獻額的80%豪直;另外80%的普通用戶承擔額外的20%的貢獻】金蜀,通過用戶分類能夠完成無價值用戶吗伤、高價值客戶的區(qū)分吃靠。那么就可以針對不同價值的用戶制定優(yōu)化的個性化方案,進而采用不同營銷策略足淆,將有限的營銷資源集中于高價值用戶巢块,實現企業(yè)利潤最大化。
【注:針對用戶價值分類 各有各的實際玩法】
實施
分析
在進行用戶分類我們的首要目標是用戶價值識別巧号,即通過實際的用戶數據識別不同價值的用戶族奢。識別用戶價值最廣泛的模型:RFM模型。
RFM模型通常涉及三個指標:最近消費時間間隔(Recency)丹鸿、消費頻率(Frequency)歹鱼、消費金額(Monetay)
- 最近消費時間間隔(Recency):用戶最近一次消費距觀測窗口結束的時間
- 消費頻率(Frequency):用戶在觀測窗口內購買商品的次數
- 消費金額(Monetay): 表示在一段時間內,用戶購買金額的總和卜高; 不過呢,可能有產品本身性質購買內容南片、商品價格等問題掺涛,會導致消費金額不同。所以盡量選擇用戶在一定時間內累計購買數量和在一定時間內購買內容對應的平均系數C來代替消費金額疼进。
另外也需要考慮用戶的注冊時間L在一定程度會影響用戶價值薪缆。
綜上所述,我們提取了5個指標作為用戶價值指標.
模型 | L(注冊時間) | R (消費時間間隔) | F (消費頻率) | M(購買商品數量) | C(購買商品對應的折扣系數的平均值) |
---|---|---|---|---|---|
LRFMC模型 | 用戶注冊時間距觀測時間結束的月份 | 用戶最近一次消費距觀測時間的月份 | 購買商品頻率 | 購買商品數量 | 購買商品對應的折扣系數的平均值 |
那么接下來我們通過使用K-Means聚類來完成最有價值用戶的識別伞广。
數據預處理
關于本節(jié)具體見數據預處理
(1)拣帽、關于5個指標數據預處理
由于原始數據源是不存在這5個指標的,需要通過原始數據提取完成的嚼锄。
L = 觀測窗口的結束時間 - 注冊時間(單位:月)
R = 最后一次消費時間至觀測窗口結束的時長(單位:月)
F = 觀測窗口內消費次數
M = 觀測窗口購買商品的總數
C = 用戶在觀測窗口內購買商品所對應的折扣系數的平均值
由于5個指標取值范圍差異比較大减拭,需要對數據進行標準化處理來消除數據量級數據帶來的影響
<code>
數據讀取
datafile <- read.csv('./data/zscoredata.csv',he=T)
數據標準化
zscoredfile <- scale(datafile)
重命名列名
colnames(zscoredfile) <- c("ZL","ZR","ZF","ZM","ZC")
數據寫入
write.csv(zscoredfile,'./tmp/zscoreddata.csv')
</code>
(2)、模型構建
用戶價值模型需要考慮兩方面:
1区丑、五個指標的數據來完成用戶的聚類分群
2拧粪、結合業(yè)務對每個用戶群進行特征分析,分析其用戶價值沧侥,進而對每個用戶群進行排名
- 用戶聚類
<code>
數據讀取(讀取第一步標準化后的數據)
inputfile <- read.csv('./tmp/zscoreddata.csv',he=T)
聚類分析
result <- kmeans(inputfile,5)
結果輸出
type <- resultcenter
</code>
結果如下圖
-
用戶價值分析
接下來針對聚類解決進行特征分析:
聚類結果
聚類類型 | 聚類個數 | L(注冊時間) | R (消費間隔) | F (消費頻率) | M(商品數量) | C(平均折扣率) |
---|---|---|---|---|---|---|
用戶群1 | 6205 | 0.17852503 | -0.0110559645 | 0.012874186 | 0.008531520 | -0.010744951 |
用戶群2 | 31024 | 0.01318265 | 0.0009489423 | -0.014321036 | -0.008730402 | -0.009925073 |
用戶群3 | 18615 | -0.15138286 | 0.0281135828 | -0.011842433 | -0.010523091 | 0.011610353 |
用戶群4 | 43432 | 0.09623873 | -0.0247513498 | 0.021888722 | 0.017190567 | 0.019278291 |
用戶群5 | 55840 | -0.13658118 | 0.0067442291 | -0.008599405 | -0.006468417 | -0.010217024 |
用戶群特征
群類型 | L(注冊時間) | R (消費間隔) | F (消費頻率) | M(商品數量) | C(平均折扣率) |
---|---|---|---|---|---|
用戶群1 | 1 | 1 | 1 | ||
用戶群2 | 1 | 1 | |||
用戶群3 | 1 | 1 | |||
用戶群4 | 1 | 1 | 1 | 1 | |
用戶群5 | 1 |
由上得出:用戶類別劃分
- 重要保持用戶
這類用戶平均折扣率C較高(一般購買商品等級較高)可霎,最近消費間隔小(R)宴杀,購買商品數據量大(M)或消費頻率高(F)癣朗,這類用戶數據高價值用戶也是最為理想用戶類型。往往貢獻值最大旺罢,所占比例卻較小旷余。 - 重要發(fā)展用戶
這類用戶平均折扣率C較高绢记,最近消費間隔小(R)荣暮,但購買商品數據量型ハА(M)或消費頻率小(F) - 重要挽留用戶
這類用戶平均折扣率C較高穗酥,購買商品數據量高(M)或消費頻率高(F)护赊,但最近消費間隔高(R) - 一般用戶
- 低價值用戶
最后兩類用戶平均折扣率C較低,購買商品數據量低(M)或消費頻率低(F)砾跃,最近消費間隔高(R)骏啰,一般會在產品搞促銷或活動類才會消費
另外本模型采用歷史數據進行建模,隨著時間的變化抽高,分析對應的數據觀測窗口也在變換判耕,需要考慮新增用戶詳情信息及業(yè)務實際情況,能夠保證一個月甚至合理業(yè)務周期運行一次模型翘骂。進而對新增用戶通過聚類中心進行判斷壁熄,并對新增用戶進行特征分析。需要注意如下
1碳竟、實際情況與判斷結果的差異草丧, 需要業(yè)務方著重關注,查看變化的原因及確認模型的穩(wěn)定性
2莹桅、模型進行重新訓練的時間沒有統一標準昌执,多半是根據經驗來決定的(常見:每半年訓練一次模型較為合適)
(3)、模型應用
在完成對各個用戶群體的特征分析后诈泼,需要進行相應的營銷手段和策略懂拾,來完成價值用戶群管理,提供產品價值铐达。類似如下:
- 會員的升級與保級
- 提高用戶消費與福利 優(yōu)惠的回饋
- 交叉營銷
- 定向定制化優(yōu)惠
后記
在完成用戶價值分析后岖赋,同樣也需要來完成用戶流失分析。具體過程可以參考價值分析過程瓮孙。
另外相關內容的定義:
比如老用戶的定義(類似購買次數大于6次)贾节,已流失用戶(類似前后一個月購買次數比例 < 50% ),準流失用戶(類似前后一個月購買次數比例 [ 50%,90%)),未流失用戶(類似前后一個月購買次數比例 >=90%)。等等 需要結合實際業(yè)務來完成衷畦。