單車銷售可視化案例總結(jié)
老師指路->http://www.reibang.com/u/1f32f227da5f
使用工具:Anaconda-jupyter、Excel专钉、powerBI
用戶消費行為的分析報告
數(shù)據(jù)為用戶在一家單車網(wǎng)站上的消費記錄
import pandas as pd
import numpy as np
columns=['user_id','order_dt','order_products','order_amount']
df=pd.read_table('bicycle_master.txt',names=columns, sep='\s+')
#\s+ 可容納多個換行符
user_id:用戶ID
order_dt:購買日期
order_products:購買產(chǎn)品數(shù)
order_amount:購買金額
df.head()#查看前五條記錄
df.describe()#查看數(shù)據(jù)描述統(tǒng)計
分析:
大部分訂單只消費了少量商品(平均2.4)坛芽,有一定值干擾
用戶的消費金額比較穩(wěn)定碱蒙,平均消費35元琳袄,中位數(shù)在25元,有一定極值的干擾
df['order_dt']=pd.to_datetime(df.order_dt,format="%Y%m%d")
df['month']=df.order_dt.values.astype('datetime64[M]')
#天數(shù)全部變?yōu)?1
#df['year']=df.order_dt.values.astype('datetime64[Y]')
#df['year']#日期全部轉(zhuǎn)化為年份
對 order_dt 列(取values)甩牺,轉(zhuǎn)換類型為datetime64[M],默認(rèn)就會是每月的第一天了累奈。設(shè)置為[Y]就是每年的1月1日贬派,然后生成新的一列 month/year
1.進(jìn)行用戶消費趨勢的分析(按月)
- 每月的消費總金額
- 每月的消費次數(shù)
- 每月的產(chǎn)品購買量
- 每月的消費人數(shù)
每月的消費總金額
grouped_month=df.groupby('month')#按月分組
order_month_amount=grouped_month.order_amount.sum()
#求每月消費總金額
order_month_amount.head()
grouped_month_info = grouped_month[['order_amount','user_id','order_products']].agg({'order_amount':sum, 'user_id': 'count', 'order_products':sum})
每月的消費次數(shù)、產(chǎn)品購買量费尽、消費人數(shù)
求每月的消費總金額(求和)赠群,消費總次數(shù)(計數(shù)),購買產(chǎn)品數(shù)(求和)旱幼,共有18個月信息
grouped_month_info.rename(columns = {'order_amount':'消費金額', 'user_id': '消費次數(shù)', 'order_products': '產(chǎn)品購買量'}, inplace=True)
grouped_month_info
求消費人數(shù)查描,將消費次數(shù)做去重處理
重置索引
將month字段轉(zhuǎn)換為字符型
grouped_month_info['消費人次'] = grouped_month['user_id'].unique().map(len)
#去重,去除一人購物多次情況
grouped_month_info = grouped_month_info.reset_index()
#重置索引
grouped_month_info['month'] = grouped_month_info['month'].astype(str)
#將month 轉(zhuǎn)換為字符型
將處理過的數(shù)據(jù)柏卤,導(dǎo)入到Excel表格中
grouped_month_info.to_excel(r'.\月銷售額冬三、銷售次數(shù)、產(chǎn)品購買量缘缚、消費人數(shù).xlsx')
將Excel數(shù)據(jù)導(dǎo)入到powerBI勾笆,可視化數(shù)據(jù)
分析:
由上圖可知,消費總金額在前三個月達(dá)到最高峰桥滨,后續(xù)消費較為穩(wěn)定窝爪,有輕微下降趨勢
產(chǎn)品購買量在前三個月達(dá)到最高峰弛车,后續(xù)消費較為穩(wěn)定,有輕微下降趨勢
前三個月消費人數(shù)在10000筆左右蒲每,后續(xù)月份的平均消費人數(shù)則在2500人
2.用戶個體消費分析
- 用戶消費金額纷跛,消費次數(shù)的描述統(tǒng)計
- 用戶消費金額和消費次數(shù)的散點圖
- 用戶消費金額的分布圖
- 用戶消費次數(shù)的分布圖
- 用戶累計消費金額占比(百分之多少的用戶占了百分之多少的消費額)
可視化結(jié)果:
分析:
1、從直方圖可知邀杏,用戶消費金額贫奠,絕大部分呈現(xiàn)集中趨勢,小部分異常值干擾了判斷望蜡,可以使用過濾操作排除異常
使用切比雪夫定理過濾掉異常值唤崭,因為切比雪夫定理說明,95%的數(shù)據(jù)都分布在5個標(biāo)準(zhǔn)差之內(nèi)脖律,剩下5%的極值就不要了
2谢肾、按照用戶消費金額進(jìn)行升序排序,由圖可以知道50%的用戶僅貢獻(xiàn)了11%的消費額度状您,而排名前5000的用戶就貢獻(xiàn)了60%的消費額度
3.用戶消費行為
- 用戶第一次消費(首購)
- 用戶最后一次消費
- 新老客戶消費比
- 多少用戶僅消費一次
- 每月新客占比
- 用戶分層
- RFM模型
- 新勒叠、老、活躍膏孟、回流眯分、流失
- 用戶購買周期(按訂單)
- 用戶消費周期描述
- 用戶消費周期分布
- 用戶生命周期(按第一次和最后一次消費) -用戶生命周期描述
- 用戶生命周期分布
可視化結(jié)果:
分析:
1、(左下圖)斷崖式下跌很正常:可以理解用戶流失比例基本一致柒桑,一開始用戶迅猛增長數(shù)量比較多流失的也比較多弊决,后面沒有用戶 用戶最后一次購買的分布比第一次分布廣
大部分最后一次購買,集中在前三個月魁淳,說明很多用戶購買了一次后就不再進(jìn)行購買
隨著時間的遞增飘诗,最后一次購買數(shù)量也在遞增,消費呈現(xiàn)流失上升的狀況(這也是正常界逛,隨著時間的增長昆稿,可能運營沒跟上,或者用戶忠誠度下降了)
2息拜、 R :消費時間 F:消費金額 M:消費頻次
從RFM 分層可知溉潭,大部分用戶是重要保持客戶,但是這是由于極值的影響少欺,所以 RFM 的劃分標(biāo)準(zhǔn)應(yīng)該以業(yè)務(wù)為準(zhǔn)喳瓣,也可以通過切比雪夫去除極值后求均值,并且 RFM 的各個劃分標(biāo)準(zhǔn)可以都不一樣
盡量用小部分的用戶覆蓋大部分的額度
不要為了數(shù)據(jù)好看劃分等級
用戶生命周期-新客赞别,活躍畏陕,回流,流失(一段時間不消費仿滔,或者不活躍)
4.復(fù)購率和回購率分析
- 復(fù)購率
- 自然月內(nèi)惠毁,購買多次的用戶占比(即犹芹,購買了兩次以上)
- 回購率
- 曾經(jīng)購買過的用戶在某一時期的再次購買的占比(可能是在三個月內(nèi))
可視化結(jié)果:
分析:
復(fù)購率穩(wěn)定在20%左右,前一個月因為有大量新用戶涌入仁讨,而這批用戶只購買了一次羽莺,所以導(dǎo)致復(fù)購率降低
總結(jié)
1 熟悉業(yè)務(wù)知識
2 pandas 函數(shù)使用
3 powerBI使用