筆記:
1、?基于RFM的精細(xì)化用戶管理厌殉,可以精細(xì)用戶管理食绿,更好的對(duì)客戶進(jìn)行引流,制定差異化以及定制化的營銷公罕。
(另外器紧,給業(yè)務(wù)部分做分析需要導(dǎo)出excel格式)
2、?使用的庫包括:time(用來記錄插入數(shù)據(jù)庫時(shí)的當(dāng)前日期)熏兄、numpy(基本數(shù)據(jù)處理)、pandas(日期轉(zhuǎn)換、數(shù)據(jù)格式化處理摩桶、主要的RFM計(jì)算過程)
RFM權(quán)重:利用sklearn的隨機(jī)森林庫
結(jié)果展示:excel可視化圖表
3桥状、?案例數(shù)據(jù):
觀察表格概要、具體數(shù)據(jù)
——導(dǎo)入庫(numpy硝清、pandas辅斟,機(jī)器學(xué)習(xí)包sklearn使用RandomForestClassifier)
——讀取數(shù)據(jù)、定義列表以方便后續(xù)定制
——數(shù)據(jù)審查(注意轉(zhuǎn)換前后格式是否一致芦拿,包括后續(xù)數(shù)據(jù)是否與真實(shí)數(shù)據(jù)一致)
——數(shù)據(jù)預(yù)處理(enumerate函數(shù)用于將一個(gè)可遍歷的數(shù)據(jù)對(duì)象(如列表士飒、元組或字符串)組合為一個(gè)索引序列,同時(shí)列出數(shù)據(jù)和數(shù)據(jù)下標(biāo))
——?jiǎng)澐謪^(qū)間(對(duì)RFM做分箱或者離散化操作)
另外:r蔗崎、m本身可以區(qū)分用戶特征酵幕,但是f無法區(qū)分(主要需要根據(jù)行業(yè)特性進(jìn)行設(shè)定數(shù)據(jù))
原則:中間2個(gè)邊界值、最大值邊界
(問題:最左側(cè)值無法劃分為任何區(qū)間的)
最小值邊界值定義得比數(shù)據(jù)框中的最小值要小缓苛。
——計(jì)算RFM因子權(quán)重
思路:我們利用會(huì)員等級(jí)來確定RFM三者的權(quán)重芳撒,建立一個(gè)rfm三個(gè)維度與會(huì)員等級(jí)的分類模型,然后通過模型輸出維度的權(quán)重未桥。
4笔刹、?案例數(shù)據(jù)結(jié)論:
(1)基于圖形交互式分析
重點(diǎn)人群分布(柱狀圖)、重點(diǎn)分組分布
(2)基于RFM分組結(jié)果的分析
建立數(shù)據(jù)透視表——將分析重點(diǎn)轉(zhuǎn)移在重點(diǎn)人群身上
(3)RFM用戶特征分析
三類:占比超過10%冬耿,占比個(gè)位數(shù)舌菜,占比小個(gè)人價(jià)值度高
5、?不同行業(yè)對(duì)RFM的依賴度有差異亦镶,包括公司的發(fā)展等都會(huì)影響到RFM
6日月、?對(duì)R、F染乌、M區(qū)間的劃分是一個(gè)離散化的過程山孔,具體需要?jiǎng)澐譃閹讉€(gè)區(qū)間,需要與業(yè)務(wù)方確認(rèn)
7荷憋、?最重要的是台颠,不要只注重于多數(shù)人的定制化分析,一定要全面分析會(huì)員人群種類進(jìn)行分析勒庄。