這是一份用戶在一家CD網(wǎng)站上的消費(fèi)記錄
1根盒、導(dǎo)入數(shù)據(jù)
--?對(duì)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)
可知用戶平均每筆訂單購(gòu)買2.4個(gè)商品牲芋,中位數(shù)為2,75分位數(shù)為3,說(shuō)明絕大部分訂單的購(gòu)買量都不多。
但是最大值為99個(gè)宠漩,數(shù)字偏高窄俏。
一般來(lái)說(shuō)攘宙,根據(jù)二八法則丈莺,20%的用戶貢獻(xiàn)的收入會(huì)占總收入的80%划煮。
--?將order_dt改為可計(jì)算的時(shí)間字符類型并將消費(fèi)頻次按月計(jì)算
查看更改以后的數(shù)據(jù)
2、進(jìn)行用戶消費(fèi)趨勢(shì)的分析(按月)
(1)每月的消費(fèi)總金額
(2)每月的用戶消費(fèi)次數(shù)
(3)每月的產(chǎn)品購(gòu)買量
(4)每月的消費(fèi)人數(shù)
(1)對(duì)每月的消費(fèi)總金額繪制折線圖分析
由圖可知缔俄,用戶發(fā)生購(gòu)買行為多在1-3月,從四月份以后器躏,消費(fèi)較為穩(wěn)定呈輕微下降趨勢(shì)
(2)對(duì)每月消費(fèi)人數(shù)繪制折線圖分析
前三個(gè)月消費(fèi)訂單次數(shù)在10000次接近12000次俐载,后續(xù)每月消費(fèi)次數(shù)則在2500次
(3)對(duì)每月產(chǎn)品購(gòu)買量繪制折線圖分析
前三個(gè)月物品購(gòu)買量約為25000元,后續(xù)月份則保持在7000元左右
(4)對(duì)每月的消費(fèi)人數(shù)繪制折線圖分析
前三個(gè)月每月的消費(fèi)人數(shù)在8000-10000之間登失,后續(xù)月份遏佣,平均消費(fèi)人數(shù)在2000不到
3、用戶個(gè)體消費(fèi)分析
(1)用戶消費(fèi)金額揽浙,消費(fèi)次數(shù)的秒速統(tǒng)計(jì)
(2)用戶消費(fèi)金額和消費(fèi)次數(shù)的散點(diǎn)圖
(3)用戶消費(fèi)金額的分布圖
(4)用戶累計(jì)消費(fèi)金額占比(百分之多少的用戶占了百分之多少的消費(fèi)額)
(1)對(duì)用戶金額及消費(fèi)次數(shù)繪制散點(diǎn)圖分析
過(guò)濾掉極值
(3)對(duì)用戶消費(fèi)金額作直方圖分析
由圖可知用戶消費(fèi)金額状婶,絕大部分呈現(xiàn)集中趨勢(shì),小部分異常值干擾了判斷馅巷,可以使用過(guò)濾操作排除異常值
(4)對(duì)用戶累計(jì)消費(fèi)金額占比作折線圖分析
由圖可知50%的用戶僅貢獻(xiàn)了15%的消費(fèi)額度膛虫,而排名前5000的用戶就貢獻(xiàn)了40%的消費(fèi)額度
3、用戶消費(fèi)行為
(1)用戶第一次消費(fèi)(首購(gòu))
(2)用戶最后一次消費(fèi)
(3)新老客戶消費(fèi)比
? ? ? ? ①多少用戶僅消費(fèi)一次
? ? ? ? ②每月新客占比
(4)用戶分層
????????①?RFM模型
????????②新钓猬、老稍刀、活躍、回流敞曹、流失
(5)用戶購(gòu)買周期(按訂單)
????????①用戶消費(fèi)周期描述
????????②用戶消費(fèi)周期分布
(6)用戶生命周期(按第一次和最后一次消費(fèi)) -用戶生命周期描述
????????①用戶生命周期分布
(7)復(fù)購(gòu)率和回購(gòu)率分析
(1)(2)對(duì)用戶第一次及最后一次消費(fèi)進(jìn)行分析
大多數(shù)人最后一次購(gòu)買時(shí)間都在1-3月份账月,說(shuō)明他們購(gòu)買了一次就不再進(jìn)行購(gòu)買,隨著時(shí)間的遞增澳迫,最后一次購(gòu)買數(shù)量也在遞增局齿,消費(fèi)呈現(xiàn)流失上升的狀況。用戶流失比例基本一致橄登,一開始用戶迅猛增長(zhǎng)數(shù)量比較多流失的也比較多抓歼。
(3)對(duì)新老客消費(fèi)比進(jìn)行分析
取每個(gè)用戶首次和最后一次購(gòu)買時(shí)間
查詢只進(jìn)行過(guò)一次購(gòu)買的用戶人數(shù)
由圖可知担平,將近一半的用戶僅僅消費(fèi)了一次,新老客戶占比接近1:1
(4)RFM模型
RFM模型的三個(gè)指標(biāo)為最近一次消費(fèi)時(shí)間锭部、消費(fèi)頻率 暂论、消費(fèi)金額?
繪制透視圖表進(jìn)行分析
要將order_dt里面具體的日期變成R中的天數(shù)
再將order_amount和order_products重命名為F、M
對(duì)用戶進(jìn)行分群(8個(gè))
將RFM中的數(shù)值換為容易理解的文字
對(duì)重要價(jià)值客戶及非重要價(jià)值客戶的消費(fèi)時(shí)間拌禾、消費(fèi)頻率繪制散點(diǎn)圖
(4)對(duì)用戶生命周期 新客取胎,活躍,回流湃窍,流失進(jìn)行分析
從上圖中可以看到闻蛀,表中數(shù)據(jù)有0,1,2···,要將有消費(fèi)的變?yōu)?您市,沒有消費(fèi)變?yōu)?
這里由于進(jìn)行數(shù)據(jù)透視觉痛,填充了一些 null 值為0,而實(shí)際可能用戶在當(dāng)月根本就沒有注冊(cè)茵休,這樣會(huì)誤導(dǎo)第一次消費(fèi)數(shù)據(jù)的統(tǒng)計(jì)薪棒。
將自定義函數(shù)運(yùn)用到數(shù)據(jù)中
將未注冊(cè)的替換為空值,這樣 count 計(jì)算時(shí)不會(huì)計(jì)算到榕莺,從而得到每個(gè)月的用戶分布
對(duì)這些用戶做面積圖分析
(5)用戶購(gòu)買周期?對(duì)用戶消費(fèi)周期進(jìn)行分析
計(jì)算相鄰兩個(gè)訂單的時(shí)間間隔俐芯,用shift 函數(shù),shift函數(shù)是對(duì)數(shù)據(jù)進(jìn)行錯(cuò)位钉鸯,所有數(shù)據(jù)會(huì)往下平移一下吧史,可以計(jì)算
以用戶分組,對(duì)兩個(gè)訂單的間隔進(jìn)行計(jì)算
NaT表示只有一次購(gòu)買
對(duì)時(shí)間間隔進(jìn)行描述性統(tǒng)計(jì)分析
去除days并繪制直方圖
用戶的平均購(gòu)買周期是68天唠雕,絕大部分用戶的購(gòu)買周期都低于100天
(6)對(duì)用戶生命周期(按第一次和最后一次消費(fèi))
描述性分析
去除days并繪制直方圖
用戶的生命周期受只購(gòu)買一次的用戶影響比較厲害贸营,所以要對(duì)用戶進(jìn)行篩選
(7)復(fù)購(gòu)率和回購(gòu)率分析
復(fù)購(gòu)率:自然月內(nèi),購(gòu)買多次的用戶占比(即岩睁,購(gòu)買了兩次以上)
回購(gòu)率:曾經(jīng)購(gòu)買過(guò)的用戶在某一時(shí)期的再次購(gòu)買的占比(可能是在三個(gè)月內(nèi))
復(fù)購(gòu)率穩(wěn)定在20%所有钞脂,前一個(gè)月因?yàn)橛写罅啃掠脩粲咳耄@批用戶只購(gòu)買了一次笙僚,所以導(dǎo)致復(fù)購(gòu)率降低