數(shù)據(jù)來源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46(阿里云天池)
一遣鼓、分析目的與主要指標
我們的目的是查看雙十一之后1個月的用戶購物情況,主要有以下指標
1. 日常訪問量
2. 購物點擊總體情況:用戶總訪問量PV涕刚、 收藏次數(shù)、購物車加入數(shù)簇捍、購買次數(shù)只壳;
3. 購物行為轉化率與行為轉化漏斗;
4. 用戶總數(shù)暑塑、下單購買人數(shù)與用戶轉化率吼句;
5. 回頭客與復購情況;
6. 查看點擊與購買次數(shù)最多/最少的客戶情況
7. 查看用戶購物活躍 時間
8. 查看用戶對商品的喜好
二事格、數(shù)據(jù)解析
表名:tianchi_user, 合計1048675行數(shù)據(jù)惕艳,共有6列/字段:
user_id:用戶編碼
item_id:商品編碼
behavior_type:用戶行為分類(1點擊,2收藏驹愚,3加入購物車远搪,4下單購買四種)
user_geohash:地理位置(無效NULL值過多,無法有效分析逢捺,隱藏或刪除此列)
item_category:商品的類別代號
time:用戶行為發(fā)生的日期時間
三谁鳍、數(shù)據(jù)整理
去重后,將該CSV文件導入Navicat
1.查看完整性劫瞳,處理缺失值
除了user_geohash已經(jīng)被隱藏/刪除/或不被導入即可倘潜,導入檢查其他5列,確認數(shù)據(jù)完整志于,無需填補涮因。
2. 分列時間
表中time 字段日期和小時合在一起,不便分析伺绽,把該字段拆分為 2 個字段养泡,一個日期+一個小時列。
-- 重命名 time 字段名稱為 date
ALTER TABLE ?tianchi_user CHANGE time date VARCHAR(255)?
-- 添加 time 列
ALTER TABLE tianchi_user ADD time VARCHAR(20);
-- 復制 date 列到 time 列
UPDATE ?tianchi_user SET time=date;
-- 在 date 列截饶斡Α(年-月-日)信息
UPDATE ?tianchi_user? SET date=REPLACE(date,date,SUBSTRING_INDEX(date,' ',1));
-- 在 time 列截取小時信息
UPDATE ?tianchi_user? SET time=REPLACE(time,time,SUBSTRING_INDEX(time,' ',-1));
拆分后表格如下:
3.把用戶行為behavior_type(1點擊澜掩,2收藏,3加入購物車钥组,4下單購買四種)改為便于識別的代號
UPDATE tianchi_user
SET behavior_type=REPLACE(behavior_type,1,'PV');
UPDATE?tianchi_user
SET behavior_type=REPLACE(behavior_type,2,'Like');
UPDATE?tianchi_user
SET behavior_type=REPLACE(behavior_type,3,'Add');
UPDATE?tianchi_user
SET behavior_type=REPLACE(behavior_type,4,'Buy');
修改后如下:
四输硝、數(shù)據(jù)查詢分析
1.日常點擊量
從圖中可以看出,雙十一之后那一個月每天的訪問量都是比較平穩(wěn)的程梦,周末沒有明顯差別。一般維持在25000-30000之間橘荠,而雙12前一天開始增加屿附,當天則是翻倍的情況
2.總體情況:點擊量PV總訪問量、 購物車數(shù)量哥童、收藏次數(shù)挺份、購買次數(shù)
初步觀察:點擊量很大而加入購物的人數(shù)卻才到點擊量的3%,這里有待觀察贮懈,可以繼續(xù)看具體的行為轉化率匀泊。
SELECT behavior_type, COUNT(*)
FROM tianchi_user
GROUP BY behavior_type;
3.用戶行為轉化率情況:漏斗模型(tableau)
從下圖中可以看出优训,PV占了總行為數(shù)的94%,而添加購物車只占3%各聘,而最后實際購買的在1%揣非,所以從點擊到添加購物車這一步,轉化最低 躲因,流失很多早敬。
原因猜想:
1)推薦的商品不到位用戶沒興趣,推薦算法有待改進大脉,
2)頁面不明確搞监,分類不清,用戶難以到達自己想要的商品子類別镰矿,
3)商品搜索關鍵字關聯(lián)度不足琐驴,用戶難以搜到自己想要的商品。
4.凈點擊用戶量UV秤标,凈購買用戶數(shù)量绝淡,客戶轉化率
由下圖,總客戶有8500抛杨,最后購買的有4300够委,總體轉化率接近51%,沒有行業(yè)對比怖现,暫時不清楚情況是好是差茁帽。
SELECT COUNT(DISTINCT user_id) AS '用戶總數(shù)' FROM tianchi_user;
#查詢下單購買用戶量
SELECT COUNT(DISTINCT user_id) AS '下單購買用戶量' FROM tianchi_user
WHERE behavior_type = 'Buy';
創(chuàng)建視圖
CREATE VIEW behavior_temp?AS
SELECT user_id, count(behavior_type) as '行為次數(shù)小計',
SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END) AS '點擊次數(shù)',
SUM(CASE WHEN behavior_type='Like' THEN 1 ELSE 0 END) AS '收藏次數(shù)',
SUM(CASE WHEN behavior_type='Add' THEN 1 ELSE 0 END) AS '購物車數(shù)',
SUM(CASE WHEN behavior_type='Buy' THEN 1 ELSE 0 END) AS '購買次數(shù)'
FROM tianchi_user
GROUP BY user_id
ORDER BY COUNT(behavior_type) DESC;
-- DROP VIEW behavior_temp
#查看用戶購物情況視圖
SELECT * FROM behavior_temp
5.查詢購買用戶數(shù)量、重復購買用戶數(shù)量以及復購率
回頭客近50%屈嗤,也還需要對比潘拨,才知道是好是差。
#查詢用戶復購率
SELECT SUM(CASE WHEN 購買次數(shù)>=2 THEN 1 ELSE 0 END) AS '復購用戶',
SUM(CASE WHEN 購買次數(shù)>0 THEN 1 ELSE 0 END) AS '總購用戶',
CONCAT(ROUND(SUM(CASE WHEN 購買次數(shù)>=2 THEN 1 ELSE 0 END)/SUM(CASE WHEN 購買次數(shù)>0 THEN 1 ELSE 0 END)*100), '%') AS '復購率'
FR?OM behavior_temp
6.#查看購買次數(shù)多的用戶情況饶号,及其購買率
1)點擊量不大铁追、購買次數(shù)多的用戶,購物目的相對比較明確茫船,一般是剛需琅束,這種客戶點擊次數(shù)/收藏次數(shù)都較少而購買率自然就上去了,這種大概適合繼續(xù)維護算谈,不易開發(fā)
2)點擊量大涩禀,購買次數(shù)多的用戶,一般是理性偏熱衷購物的用戶然眼,這大概是我們的重點維護艾船,適當開發(fā)的對象
SELECT user_id, 點擊次數(shù), 收藏次數(shù), 購物車數(shù), 購買次數(shù),
CONCAT(ROUND(購買次數(shù)/點擊次數(shù)*100, 2),'%') AS '購買率'
FROM behavior_temp
GROUP BY user_id
ORDER BY 購買次數(shù) DESC;
3)購買次數(shù)少點擊少的用戶,我們琢磨不透建議繼續(xù)觀察或放棄;
4)購買次數(shù)少屿岂,點擊次數(shù)多的用戶可能是選擇困難癥或是十分精明克制的客戶践宴,這種是否可以通過優(yōu)惠活動或精準營銷推送吸引其關注,重點開發(fā)爷怀。
SELECT user_id, 點擊次數(shù), 收藏次數(shù), 購物車數(shù), 購買次數(shù),
CONCAT(ROUND(購買次數(shù)/點擊次數(shù)*100, 2),'%') AS '購買率'
FROM behavior_temp
GROUP BY user_id
ORDER BY 購買次數(shù) ASC;
7.#查看每天用戶活躍時段
晚上8點到10點是用戶購物活躍的高峰阻肩,所以在流量容量的分配,以及晚上客服的排班上可以有所擴張霉撵。在這個時段有效運用活動推廣磺浙。
SELECT time, count(behavior_type) as '行為次數(shù)小計',
SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END) AS '點擊次數(shù)',
SUM(CASE WHEN behavior_type='Like' THEN 1 ELSE 0 END) AS '收藏次數(shù)',
SUM(CASE WHEN behavior_type='Add' THEN 1 ELSE 0 END) AS '購物車數(shù)',
SUM(CASE WHEN behavior_type='Buy' THEN 1 ELSE 0 END) AS '購買次數(shù)'
FROM tianchi_user
GROUP BY time
ORDER BY COUNT(behavior_type) DESC;
7.#查看用戶對商品的喜好,以點擊量為基準
#查看用戶點擊最多的商品類別
SELECT item_category, COUNT(item_category) AS '商品類別點擊量'
FROM tianchi_user
WHERE behavior_type = 'PV'
GROUP BY item_category
ORDER BY 商品類別點擊量 DESC;
點擊最多的類別為1863徒坡,前6類商品的點擊量均已超過2萬撕氧,后續(xù)直線下降。
#查看用戶點擊最多商品名稱
SELECT item_category, item_id, COUNT(item_id) AS '商品點擊量'
FROM tianchi_user
WHERE behavior_type = 'PV'
GROUP BY item_id
ORDER BY 商品點擊量 DESC;
點擊量最多的商品為112921337喇完,可以看到點擊量最多的商品并不在點擊最多的商品類別里面伦泥,這很正常,可以猜測用戶在尋找這幾個商品時都很明確锦溪。
五不脯、總結問題與改善建議
1、整體上用戶行為轉化率近1%刻诊,主要在用戶點擊后加入購物車或收藏的這一環(huán)節(jié)轉換率過低防楷,可通過精準營銷或作活動引流,增強商品關鍵字搜索關聯(lián)性等等手段提高用戶轉化则涯。
2复局、購買次數(shù)多的用戶,購買率較高粟判,同時點擊量并不高亿昏,說明他們購物目標明確,很有可能是剛需档礁,這些用戶需要保持就好角钩;購買次數(shù)多,點擊量也多的用戶可能是理性消費用戶需要重點維護呻澜,適當開發(fā)递礼。
購買次數(shù)少點擊少的用戶,我們琢磨不透建議繼續(xù)觀察或放棄羹幸;購買次數(shù)少宰衙,點擊次數(shù)多的用戶可能是選擇困難癥或是十分精明克制的客戶,這種是否可以通過活動或精準營銷推送吸引其關注睹欲,重點開發(fā)。
3、用戶日尘酱活躍度通常都比較平穩(wěn)袋哼,維持在25000-30000之間。在一天中闸衫,用戶在晚上8--11點最為活躍涛贯,這個時段網(wǎng)站流量,促銷活動蔚出,客服支持等等可以向此傾斜弟翘。
4、用戶點擊最多的6類商品均已突破2萬骄酗,初步預測那六類商品用戶需求較大稀余,而點擊最多的具體商品112921337,用戶點擊前4的商品對應的類別不在點擊最多的商品類別里面趋翻,說明這個類別的商品睛琳,用戶尋找的目的比較明確。