?一吓揪、RFM模型簡介
1亲怠、釋義
RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段。在眾多的客戶關(guān)系管理(CRM)的分析模式中磺芭,RFM模型是被廣泛提到的赁炎。該機械模型通過一個客戶的近期購買行為、購買的總體頻率以及花了多少錢3項指標(biāo)來描述該客戶的價值狀況钾腺。
R:最近一次消費 (Recency):代表用戶距離當(dāng)前最后一次消費的時間
F:消費頻率 (Frequency):用戶在一段時間內(nèi)徙垫,對產(chǎn)品的消費頻次
M:消費金額 (Monetary):代表用戶的貢獻價值
一般情況下,我們將R放棒、F姻报、M分別分五個維度打分,通過歸一化打分之后间螟,把用戶所打分值與所有用戶的總分均值作高低比較吴旋,再將R损肛、F、M每個方向定義為:高荣瑟、低治拿,兩個方向,如此可將用戶分為222=8類笆焰,如下:
當(dāng)我們將客戶分類后劫谅,便可以針對性指定精細化運營策略,幫助大家了解完RFM模型后嚷掠,我將用一個實例具體展示操作流程捏检,以下實例以某玩家作品網(wǎng)站為例,爬取前十個網(wǎng)頁共240個玩家作品的昵稱不皆、編號贯城、點贊數(shù)、積分霹娄、上傳日期時間等信息進行分析能犯,具體流程如下:
1 數(shù)據(jù)爬取
2 數(shù)據(jù)清洗
3 數(shù)據(jù)分析
3.1 重新定義RFM
3.2 定義RFM打分標(biāo)準(zhǔn)
3.3 歸一化打分
3.4 計算RFM均值
3.5 用戶分類
3.6 統(tǒng)計與可視化
4 運營策略
1 數(shù)據(jù)爬取
import requests
from bs4 import BeautifulSoup
import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
?
#獲取十個網(wǎng)頁網(wǎng)址
url_lst=[]
for i in range(1,11):
urli='http://www.minicap.com/works?page='+str(i)
url_lst.append(urli)
print(url_lst)
?
#獲取十個網(wǎng)頁共240個作品的網(wǎng)址
word_lst = []
n = 1
for url in url_lst:
ri = requests.get(url)
soupi = BeautifulSoup(ri.text,'lxml')
info=soupi.find('div',class_='list_det').find('ul').find_all('li',class_='zp_list')
for i in info:
urli=' http://www.minicap.com'+i.find('a')['href']
word_lst.append(urli)
print('成功獲取第%i條網(wǎng)址'%n)
n+=1
print(word_lst)
?
#獲取240個作品的相關(guān)信息
def get_data(url):
ri=requests.get(url=url)
soupi=BeautifulSoup(ri.text,'lxml')
dic = {}
dic['num']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p1 dls').text[3:]
dic['author']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p2 dls').text.split(' ')[0][3:]
info=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fxr').find('div',class_='det').find('p',class_='p3 dls').text.split(' ')
for i in info[:]:
if ''in info:
info.remove('')
if '\n' in info:
info.remove('\n')
dic['date']=info[0]
dic['time']=info[1]
dic['integral']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fx').find('div',class_='ndjj').find('span',class_='jj').text.replace(' ','')[3:]
dic['like_num']=soupi.find('div',class_='news_l news_det_l').find('div',class_='det_cont sw').find('div',class_='det_fx').find('div',class_='fx').find('div',class_='ndjj').find('div',class_='dz_box').find('span',class_='dz_num').text
return dic
info_list = []
n=1
for url in word_lst:
info_list.append(get_data(url))
print('成功獲取第%i個網(wǎng)址的基本信息'%n)
n+=1
2 數(shù)據(jù)清洗
#數(shù)據(jù)清洗
df=pd.DataFrame(info_list)
for i in range(len(df)):
df['author'][i]=df['author'][i].split('\n')[0]
df['like_num'][i]=df['like_num'][i].split('\n')[1]
print(df)
?
#查看數(shù)據(jù)維度和結(jié)構(gòu)
print(df.dtypes)
print('-----------------')
print(df.info())
?
#修改數(shù)據(jù)類型
df['integral']=df['integral'].astype(int)
df['like_num']=df['like_num'].astype(int)
df['date']=pd.to_datetime(df['date'])
print(df.dtypes)
?
#數(shù)據(jù)保存
df.to_excel(r'C:\Users\Lenovo\Desktop\小瓶蓋數(shù)據(jù).xlsx')
3 數(shù)據(jù)分析
3.1 重新定義RFM
由于獲取的是作品相關(guān)信息(獲取信息有限),所以在此對RFM進行重新定義:
R:最近一次上傳作品日期據(jù)今天幾天犬耻;
F:作品數(shù)(用戶最近一段時間內(nèi)上傳作品的數(shù)量)悲雳;
M:點贊數(shù)(用戶最近一段時間內(nèi)上傳作品的點贊總數(shù))
3.2 定義RFM打分標(biāo)準(zhǔn)
3.3 歸一化打分
3.4 計算RFM均值
3.5 用戶分類
將3.3與3.4比較得出用戶分類
3.6 統(tǒng)計與可視化
4 運營策略
以上便是此次操作全過程,不當(dāng)之處香追,還請指正,謝謝坦胶!