這是第一次數(shù)據(jù)分析的實踐星持,選擇了比較經(jīng)典的淘寶用戶行為數(shù)據(jù)集抢埋,考慮到這個數(shù)據(jù)集比較大,能夠了解一下各種程序?qū)讉€G的數(shù)據(jù)文件的運行能力督暂。
本次分析主要分五個步驟進行:
理解數(shù)據(jù) →提出問題 →數(shù)據(jù)清洗 →建模分析 →總結(jié)建議
由于是先拿到數(shù)據(jù)集揪垄,再進行分析,所以此次分析的步驟為先理解數(shù)據(jù)损痰,再思考通過這樣一份數(shù)據(jù)的分析能夠獲得的對業(yè)務(wù)有用的信息福侈。
一、理解數(shù)據(jù)
數(shù)據(jù)來源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
本數(shù)據(jù)集包含了2017年11月25日(周六)至2017年12月3日(周日)之間卢未,有行為的約一百萬隨機用戶的所有行為(行為包括點擊肪凛、購買、加購辽社、喜歡)伟墙。數(shù)據(jù)集的每一行表示一條用戶行為,由用戶ID滴铅、商品ID戳葵、商品類目ID、行為類型和時間戳組成汉匙,每一列的詳細(xì)描述如下:
列名稱 | 說明 |
---|---|
user_id | 整數(shù)類型拱烁,序列化后的用戶ID |
item_id | 整數(shù)類型,序列化后的商品ID |
category_id | 整數(shù)類型噩翠,序列化后的商品所屬類目ID |
behavior | 字符串戏自,枚舉類型,用戶行為類型伤锚,包括('pv','buy','cart','fav') |
Timestamp | 行為發(fā)生的時間戳 |
注意到擅笔,用戶行為類型共有四種,它們分別是
行為類型 | 說明 |
---|---|
pv | 商品詳情頁pv屯援,等價于點擊 |
buy | 商品購買 |
cart | 將商品加入購物車 |
fav | 收藏商品 |
觀察數(shù)據(jù)猛们,這份數(shù)據(jù)集的分析報告對象應(yīng)該是淘寶的管理者,對于這份數(shù)據(jù)的分析主要應(yīng)該站在一個淘寶平臺數(shù)據(jù)運營的角度狞洋,思考這份數(shù)據(jù)對于業(yè)務(wù)的提升有什么作用弯淘,深度挖掘各數(shù)據(jù)指標(biāo)背后所隱藏的有用信息。
二吉懊、提出問題
1耳胎、數(shù)據(jù)集期間平臺的各項總體運營指標(biāo)(流量惯吕、轉(zhuǎn)化率等)如何?
2怕午、不同時間周期下的用戶行為有什么規(guī)律废登?如何利用這些規(guī)律?
3郁惜、基于AARRR模型分析每個環(huán)節(jié)的用戶運營情況堡距,提出改進建議。
4兆蕉、分析每個用戶獨特的行為偏好羽戒,考慮能夠提供怎樣的個性化的服務(wù)?
5虎韵、瀏覽易稠、收藏、加購物車包蓝、下單最多的商品分別是哪些驶社?相互之間有什么關(guān)聯(lián)?
6测萎、哪些商品類別的銷量較高亡电?有什么特征?
三硅瞧、數(shù)據(jù)清洗
- 縮減數(shù)據(jù)集——數(shù)據(jù)抽樣
由于原始數(shù)據(jù)1億多條記錄過于龐大份乒,直接導(dǎo)入MySQL數(shù)據(jù)庫太慢(使用Navicat Premium),本文選擇按照固定間距為30按順序抽取user_id中的部分用戶的行為數(shù)據(jù)腕唧,最終生成的數(shù)據(jù)表記錄為3308461條或辖。這一過程使用到了Python,順便添加了列標(biāo)題枣接,實現(xiàn)代碼如下:
import pandas as pd
file_path = "/Users/***/Desktop/UserBehavior.csv"
data = pd.read_csv(file_path,names = ['user_id','item_id','category_id','behavior','Timestamp'])
lst = list(range(1,1000000,30))
data2 = data[data['user_id'].isin(lst)]
data2.to_csv("/Users/***/Desktop/tb_user.csv",index=False)
-
導(dǎo)入數(shù)據(jù)庫
先在數(shù)據(jù)庫中建好對應(yīng)表
導(dǎo)入數(shù)據(jù)——選擇數(shù)據(jù)文件
由于數(shù)據(jù)表中已有列標(biāo)題孝凌,將欄位名行改為1,第一行改為2月腋。
導(dǎo)入成功,用時30s瓣赂。 -
選取子集
只有5個字段榆骚,每個字段都具有分析意義,無需剔除煌集。
-
重復(fù)值處理
本數(shù)據(jù)集中允許存在每個字段都完全相同的兩條記錄妓肢,理解為某一用戶在某一時間對數(shù)量為2的同一個商品進行的操作(例如在一單中購買兩個數(shù)量的某商品),因此無需刪除重復(fù)值苫纤。
-
缺失值處理
數(shù)據(jù)導(dǎo)入時設(shè)置了NOT NULL碉钠,杜絕缺失值出現(xiàn)纲缓。
-
一致化處理
- 添加date_time字段,將原Timestamp列時間戳轉(zhuǎn)換為日期+時間格式
- 添加date字段喊废,提取date_time中的日期部分
- 添加hour字段祝高,提取date_time中的小時部分
ALTER TABLE tb_user ADD COLUMN date_time datetime;
UPDATE tb_user SET date_time = FROM_UNIXTIME(`Timestamp`);
ALTER TABLE tb_user ADD COLUMN date date;
UPDATE tb_user SET date = DATE(date_time);
ALTER TABLE tb_user ADD COLUMN hour int;
UPDATE tb_user SET hour = EXTRACT(HOUR FROM date_time);
(這段代碼的執(zhí)行速度比較慢,300萬行的數(shù)據(jù)量會中斷連接1次污筷,需將UPDATE語句重復(fù)執(zhí)行兩次)
-
異常值處理
6.1 在表界面工闺,點擊字段名稱后面的小箭頭,選擇升序和降序排序瓣蛀,查看
user_id
陆蟆、item_id
、category_id
列無異常值惋增。
6.2
date_time
列按升序和降序排列后發(fā)現(xiàn)都有一些異常值叠殷。
異常數(shù)據(jù)無法確認(rèn)真實時間,對超出本數(shù)據(jù)集時間范圍2017-11-25日至2017-12-03日之外的數(shù)據(jù)诈皿,全部作刪除處理林束,一共有2065條記錄。DELETE FROM tb_user WHERE date > '2017-12-03' OR date < '2017-11-25';
6.3 檢查behavior
列纫塌,無異常值SELECT * FROM tb_user WHERE behavior NOT IN ('pv','buy','cart','fav');
四诊县、建模分析
1. 總體運營指標(biāo)
總體運營指標(biāo)可以對一段時間內(nèi)平臺用戶使用的整體情況有一個宏觀的了解,通過與不同時期數(shù)據(jù)的縱向?qū)Ρ却胱螅梢缘贸鲞@段時期內(nèi)的整體運營情況好壞依痊。通過與同行業(yè)競爭者數(shù)據(jù)的橫向?qū)Ρ龋梢园l(fā)現(xiàn)自身平臺的優(yōu)勢與不足怎披。
- 1 流量類指標(biāo)
- 獨立訪客總數(shù)uv
- 頁面總訪問數(shù)pv
- 人均頁面訪問數(shù)pv/uv
SELECT COUNT(DISTINCT user_id) as uv
,(SELECT COUNT(behavior) FROM tb_user WHERE behavior = 'pv') as pv
,(SELECT COUNT(behavior) FROM tb_user WHERE behavior = 'pv')/COUNT(DISTINCT user_id) as 'pv/uv'
FROM tb_user;
- 2 用戶行為轉(zhuǎn)化率——漏斗模型
-- 各種行為發(fā)生次數(shù)
SELECT behavior ,COUNT(behavior) as 次數(shù)
FROM tb_user
GROUP BY behavior
ORDER BY behavior DESC;
- 可以看到凉逛,所有用戶從瀏覽到收藏+購物車的轉(zhuǎn)化率是9.39%性宏,從收藏+購物車到購買的轉(zhuǎn)化率是23.77%,最終從瀏覽到購買的訪問下單轉(zhuǎn)化率只有2.23%状飞,說明用戶花費了大量的時間瀏覽尋找合適的產(chǎn)品毫胜,這就需要優(yōu)化平臺的篩選功能,使用戶更容易找到合適的產(chǎn)品诬辈,提升使用體驗酵使。
- 3 跳失率
跳失率 = 只點擊1次瀏覽的用戶數(shù)量/獨立訪客總數(shù)
-- 只點擊1次瀏覽用戶
SELECT t1.user_id ,behavior
FROM tb_user t1
INNER JOIN(
SELECT user_id ,COUNT(behavior)
FROM tb_user
GROUP BY user_id
HAVING COUNT(behavior) = 1) as t2
ON t1.user_id = t2.user_id
WHERE behavior = 'pv';
- 如圖,查詢結(jié)果為空焙糟,跳失率是0口渔,所有的用戶在第一次瀏覽后又發(fā)生了其他的行為,說明淘寶擁有足夠的吸引力讓用戶停留在界面中穿撮。
2. 基于AARRR模型的用戶運營分析
- 1 用戶獲取
本數(shù)據(jù)集中的用戶全部是已激活使用的用戶缺脉,此處用新增訪客數(shù)作為獲客能力的分析痪欲。淘寶本身用戶基數(shù)已經(jīng)比較大,由于數(shù)據(jù)集期間較短攻礼,新增訪客可能主要是一段時間未使用的用戶业踢,也會有少數(shù)新注冊用戶,此處統(tǒng)一作為新用戶看待秘蛔。
-- 日新增訪客數(shù)
SELECT 日期 ,COUNT(user_id) as 新增訪客數(shù)
FROM (SELECT user_id ,MIN(date) as 日期
FROM tb_user
GROUP BY user_id) as s1
GROUP BY 日期;
- 2017年11月25日是第一天陨亡,新增訪客數(shù)沒有參考意義。從第二天開始分析深员,后面幾天新增訪客數(shù)快速減少负蠕,12月2日和3日甚至零新增,平臺獲客能力大大下降倦畅。最后兩天的訪客數(shù)大幅增加遮糖,說明主要是前幾日流失的客戶受活動吸引,又重新回來消費了叠赐,活動完全沒有吸引到新用戶欲账。后期需要加強平臺的渠道曝光量和活動宣傳范圍,設(shè)置長期未使用用戶的專屬優(yōu)惠券或新客專享優(yōu)惠以吸引新用戶芭概。
- 2 提高活躍度
- 2.1 不同日期的用戶活躍規(guī)律
SELECT `date`
,COUNT(DISTINCT user_id) as 訪客數(shù)
,SUM(CASE WHEN behavior = 'pv' THEN 1 ELSE 0 END) as 點擊
,SUM(CASE WHEN behavior = 'fav' THEN 1 ELSE 0 END) as 收藏
,SUM(CASE WHEN behavior = 'cart' THEN 1 ELSE 0 END) as 加購物車
,SUM(CASE WHEN behavior = 'buy' THEN 1 ELSE 0 END) as 購買
FROM tb_user
GROUP BY `date`;
-
從圖中可以得出如下結(jié)論:
1赛不、日點擊量和日訪客數(shù)的趨勢有高度相關(guān)性;
2罢洲、從2017年11月25日~2017年12月1日的一周內(nèi)踢故,各項指標(biāo)都沒有明顯的波動,周末與工作日沒有太大區(qū)別惹苗。點擊殿较、收藏、加購物車次數(shù)在周一至周四略低于周五至周日桩蓉,購買次數(shù)則相反淋纲,說明用戶在空閑時間充足的時候更喜歡瀏覽和挑選,在工作期間則更有下單的沖動院究;
3洽瞬、同樣是周末,2017年12月2日~2017年12月3日的各項數(shù)據(jù)比起上個周末有了明顯的增加业汰,可能是在這兩天做了活動伙窃;
4、日人均頁面訪問量基本持平蔬胯,在13±0.5之間波動,說明周末和平臺活動都對人均頁面訪問量沒有顯著的影響位他,要提高流量數(shù)據(jù)主要還是在于增加訪客數(shù)氛濒。- 2.2 一天內(nèi)不同時間的用戶行為分析
SELECT `hour`
,SUM(CASE WHEN behavior = 'pv' THEN 1 ELSE 0 END) as 點擊
,SUM(CASE WHEN behavior = 'fav' THEN 1 ELSE 0 END) as 收藏
,SUM(CASE WHEN behavior = 'cart' THEN 1 ELSE 0 END) as 加購物車
,SUM(CASE WHEN behavior = 'buy' THEN 1 ELSE 0 END) as 購買
FROM tb_user
GROUP BY `hour`;
- 可以看出产场,用戶每天0點~8點睡眠時間活躍度較低,白天9點~18點都保持在一個較為平穩(wěn)的中等活躍度水平舞竿,從19點開始京景,活躍度迅速上升,21~22點達到頂峰骗奖,之后回落确徙。說明用戶喜歡在晚上下班至睡覺前的時間段內(nèi)逛淘寶,在這段時間推送一些短信或系統(tǒng)通知可以更容易地吸引用戶進入淘寶使用执桌。
- 此外鄙皇,用戶購買次數(shù)在白天和傍晚差不多,說明人們多數(shù)會在晚上逛淘寶挑選商品仰挣,在白天下單伴逸。可以將一些下單優(yōu)惠(如淘金幣抵扣)膘壶,或用戶收藏和購物車內(nèi)商品的相關(guān)通知放在白天推送错蝴,提升用戶下單轉(zhuǎn)化率。還可以建議商家把一天的發(fā)貨時間設(shè)在18點以后颓芭,以減少用戶等待發(fā)貨的時間顷锰,提升用戶使用體驗度。
- 3 用戶留存
計算用戶留存率較為復(fù)雜亡问,分為四個步驟:
第一步:獲取每個用戶第一次使用的日期
第二步:計算每個用戶之后每次使用與第一次使用日期的間隔天數(shù)
第三步:匯總每日新增用戶不同間隔天數(shù)的留存人數(shù)
第四步:計算每日留存率
SELECT firstday
,day0 as 新增用戶
,CONCAT(ROUND(day1/day0*100,2),'%') as 'day1_%'
,CONCAT(ROUND(day2/day0*100,2),'%') as 'day2_%'
,CONCAT(ROUND(day3/day0*100,2),'%') as 'day3_%'
,CONCAT(ROUND(day4/day0*100,2),'%') as 'day4_%'
,CONCAT(ROUND(day5/day0*100,2),'%') as 'day5_%'
,CONCAT(ROUND(day6/day0*100,2),'%') as 'day6_%'
,CONCAT(ROUND(day7/day0*100,2),'%') as 'day7_%'
,CONCAT(ROUND(day8/day0*100,2),'%') as 'day8_%'
FROM(
SELECT firstday
,SUM(CASE WHEN days_diff = 0 THEN 1 ELSE 0 END) as day0
,SUM(CASE WHEN days_diff = 1 THEN 1 ELSE 0 END) as day1
,SUM(CASE WHEN days_diff = 2 THEN 1 ELSE 0 END) as day2
,SUM(CASE WHEN days_diff = 3 THEN 1 ELSE 0 END) as day3
,SUM(CASE WHEN days_diff = 4 THEN 1 ELSE 0 END) as day4
,SUM(CASE WHEN days_diff = 5 THEN 1 ELSE 0 END) as day5
,SUM(CASE WHEN days_diff = 6 THEN 1 ELSE 0 END) as day6
,SUM(CASE WHEN days_diff = 7 THEN 1 ELSE 0 END) as day7
,SUM(CASE WHEN days_diff = 8 THEN 1 ELSE 0 END) as day8
FROM(
SELECT t1.user_id ,t1.date ,t2.firstday ,DATEDIFF(t1.date,t2.firstday) as days_diff
FROM tb_user as t1
INNER JOIN (SELECT user_id ,MIN(`date`) as firstday
FROM tb_user
GROUP BY user_id) as t2
ON t1.user_id = t2.user_id
GROUP BY t1.user_id,t1.date
) as t3
GROUP BY firstday
) as t4
GROUP BY firstday;
- 可以看出屉凯,每一期的用戶留存率都比較穩(wěn)定,沒有隨著時間的推移而衰減溉瓶,說明留存用戶對淘寶的使用粘性非常高伤疙;
- 最后兩日沒有新增用戶,活動吸引的主要是前幾日的老用戶慎框,兩天活動期間的留存率達到了95%以上良狈,有20%~30%是因為活動而回流,說明老用戶對于活動的關(guān)注度和參與度都非常高笨枯。
- 4 用戶收益
- 4.1 付費用戶占比PUR
-- 總消費人數(shù)
SELECT COUNT(DISTINCT user_id) as 總消費人數(shù)
FROM tb_user
WHERE behavior = 'buy';
付費用戶占比 = 總消費人數(shù)/獨立訪客總數(shù) = 22017/32366*100% = 68.03%
-
使用淘寶的用戶中有68%都產(chǎn)生了購買行為薪丁,用戶付費轉(zhuǎn)化率相當(dāng)高。
- 4.2 復(fù)購率
-- 不同消費次數(shù)的人數(shù)
- 4.2 復(fù)購率
SELECT buy_times
,COUNT(user_id) as 人數(shù)
FROM(
SELECT user_id
,COUNT(behavior) as buy_times
FROM tb_user
WHERE behavior = 'buy'
GROUP BY user_id
) as t1
GROUP BY buy_times;
- 消費1次的人數(shù)占比 = 7335/22017*100% = 33.32%
-
復(fù)購率 = 1 - 消費1次的人數(shù)占比 = 66.68%
由此可知馅精,在有購買行為的用戶中严嗜,有66.68%的用戶會再次發(fā)生購買行為,復(fù)購率比較高洲敢。另外消費次數(shù)大部分集中在10次以內(nèi)漫玄,占總消費人數(shù)的97.80%,消費1次的人數(shù)最多,占總消費人數(shù)的1/3睦优。最高消費次數(shù)可達53次渗常,需重點關(guān)注高消費頻率客戶的客戶價值。
3. 單用戶行為分析
-------- 針對每個用戶提供個性化服務(wù)
- 1 單用戶商品偏好分析
-- 用戶瀏覽商品所屬類目排名
SELECT user_id ,category_id ,COUNT(behavior) as view_times
FROM tb_user
WHERE behavior = 'pv'
GROUP BY user_id ,category_id
ORDER BY user_id ,view_times DESC;
- 用戶瀏覽某個類目下的商品次數(shù)較多時汗盘,說明他可能是在同一類目下的不同商品之間挑選皱碘,此時可以根據(jù)該用戶瀏覽商品類目次數(shù)的排名,在推薦頁面優(yōu)先推薦瀏覽次數(shù)多的類目下的其他商品隐孽。
- 2 單用戶購買偏好
-- 用戶收藏或加入購物車了癌椿,但是沒有購買的商品
SELECT t1.user_id ,t1.item_id
FROM(
SELECT user_id ,item_id
FROM tb_user
WHERE behavior = 'fav'
OR behavior = 'cart'
GROUP BY user_id,item_id
) as t1
LEFT JOIN(
SELECT user_id ,item_id
FROM tb_user
WHERE behavior = 'buy'
GROUP BY user_id,item_id
) as t2
ON t1.user_id = t2.user_id
AND t1.item_id = t2.item_id
WHERE t2.user_id IS NULL;
- 用戶對收藏或加入購物車的商品購買意愿是比較強烈的,可能因為某些原因還沒有成交菱阵。針對這些商品有針對性地給用戶推出一些優(yōu)惠活動踢俄,可以提高這些用戶下單的概率。
4. 商品相關(guān)分析
- 1 不同行為的商品排名分析
-- 商品銷量前20(其他排名代碼類似)
SELECT item_id ,count(behavior) AS '銷售量'
FROM tb_user
WHERE behavior = 'buy'
GROUP BY item_id
ORDER BY 銷售量 DESC
LIMIT 20;
-
銷量最高的商品是item_id為3122135的商品送粱,購買次數(shù)有37次褪贵,排在第二和第三位的商品購買次數(shù)均為33次。
-
在瀏覽量前20的商品中抗俄,只有3個商品銷量較高脆丁,瀏覽量前6名的商品都不在銷量榜單中,說明這些商品在吸引用戶方面做的較好动雹,但并沒有很好的轉(zhuǎn)化為實際銷量槽卫。
-
收藏數(shù)前20的商品也僅有740947和1535294的銷量排名較高,但收藏數(shù)前幾位的商品與瀏覽量前幾名重合度較高胰蝠,說明瀏覽量高的商品收藏轉(zhuǎn)化率也較高歼培。
加購數(shù)前20的商品中,有5個進入了銷量前20茸塞,且集中排列在銷量第4位至第9位之間躲庄,說明銷量與加購數(shù)的關(guān)系更為密切。
總的來說钾虐,做的最好的商品是1535294噪窘,各項指標(biāo)都排在靠前的位置,將高瀏覽量成功地轉(zhuǎn)化為了收藏和加購數(shù)效扫,進而轉(zhuǎn)化為銷量倔监,可以作為一個典型的例子推廣學(xué)習(xí)。對其他單銷量高或單瀏覽量高的商品群可以進一步分析其特征優(yōu)勢菌仁,從而交叉向有另一方面弱勢的商家推出對應(yīng)的增值指導(dǎo)服務(wù)浩习。
- 2 商品購買次數(shù)分布
-- 計算不同購買次數(shù)的商品數(shù)各有多少個
SELECT 購買次數(shù) ,COUNT(item_id) as 商品數(shù)
FROM (SELECT item_id ,COUNT(behavior) as 購買次數(shù)
FROM tb_user
WHERE behavior = 'buy'
GROUP BY item_id) as buy_times
GROUP BY 購買次數(shù);
- 只購買1次的商品最多,有42118個济丘,占購買商品總數(shù)的82.77%谱秽,購買兩次的商品有5902個,占比11.60%,說明商品的銷售主要是依靠長尾商品的累計效應(yīng)疟赊,而非爆款商品的帶動辱士。
- 3 商品類別偏好
-- 計算不同類別下商品的總銷量以及包含的商品數(shù),按銷量排序
SELECT t1.category_id
,t2.sales
,COUNT(distinct t1.item_id) as item_num
FROM tb_user t1
JOIN (SELECT category_id ,COUNT(*) as sales
FROM tb_user
WHERE behavior = 'buy'
GROUP BY category_id) as t2
ON t1.category_id = t2.category_id
GROUP BY category_id
ORDER BY sales DESC;
- 如圖听绳,銷量最高的幾個商品類別總銷量均在1000個左右,且有一個共同特征——所包含的商品數(shù)都很多异赫,這也比較好理解椅挣,銷量多的商品類別受用戶關(guān)注度高,入駐的商家就會增多塔拳,各商家之間的產(chǎn)品相互替代性較高鼠证,這就形成了商品銷售的長尾現(xiàn)象。在平臺活動頁面靠抑,可以將銷量高的商品類別入口放在更顯眼的位置量九,以更好地吸引用戶。
五颂碧、總結(jié)建議
用戶從瀏覽到收藏+購物車的轉(zhuǎn)化率是9.39%荠列,從收藏+購物車到購買的轉(zhuǎn)化率是23.77%,訪問下單轉(zhuǎn)化率只有2.23%载城,說明用戶花費了大量的時間瀏覽尋找合適的產(chǎn)品肌似。需要優(yōu)化平臺的篩選和推薦功能,使用戶更容易找到合適的產(chǎn)品诉瓦,提升使用體驗川队。
基于AARRR模型的分析結(jié)論
(1)用戶獲取:數(shù)據(jù)集期間每日新增訪客數(shù)快速減少睬澡,平臺活動也完全沒有吸引到新用戶固额。淘寶本身用戶基數(shù)已經(jīng)比較大,獲取新注冊用戶的邊際成本太高煞聪,要提高訪客數(shù)應(yīng)更重視休眠用戶的激活斗躏。后期需要加強平臺的渠道曝光量和活動宣傳范圍,設(shè)置長期休眠用戶的激活優(yōu)惠券或新客專享優(yōu)惠以吸引新增用戶米绕。
(2)提高活躍度:
①用戶使用淘寶的頻率在工作日與周末的差別不大瑟捣,周末和平臺活動都對日人均頁面訪問量沒有顯著的影響,要提高流量數(shù)據(jù)主要還是在于增加訪客數(shù)栅干。在周末推出一些優(yōu)惠活動能顯著地提高用戶的活躍度迈套。
②在一天之內(nèi),用戶更喜歡在晚上下班至睡覺前的時間內(nèi)逛淘寶碱鳞,在19點之后開始推送一些短信或系統(tǒng)通知可以更容易地吸引客戶使用淘寶桑李。白天9點~18點的時間段內(nèi)則可以多推送一些下單優(yōu)惠,或用戶收藏和購物車內(nèi)商品的相關(guān)通知,提升用戶下單轉(zhuǎn)化率贵白。
(3)用戶留存:淘寶用戶的留存率比較高且比較穩(wěn)定率拒,留存用戶使用粘性非常強,通過適當(dāng)?shù)赝瞥龌顒幽軌蜻_到95%以上的留存率禁荒。
(4)用戶收益:用戶付費轉(zhuǎn)化率可達到68%猬膨,付費用戶中有復(fù)購行為的用戶又占到了66.68%,說明用戶整體的消費能力相當(dāng)強呛伴。針對消費頻率較高的客戶勃痴,需重點關(guān)注其客戶價值,了解用戶的偏好和需求热康,提供諸如會員服務(wù)等更加個性化的服務(wù)以維持客戶沛申。
(5)傳播推薦:從新增訪客數(shù)來看,淘寶用戶的自傳播能力較差姐军,可以通過設(shè)置聯(lián)合使用優(yōu)惠券或推薦新客獎勵铁材,提高用戶傳播率。用戶個性化服務(wù)方面奕锌,根據(jù)用戶瀏覽商品類目次數(shù)的排名著觉,可以在推薦頁面提供更加個性化的推薦服務(wù),優(yōu)先推薦瀏覽次數(shù)多的類目下的其他商品惊暴。對于用戶收藏或加入了購物車固惯,還沒有購買的商品,可以向用戶推送一些商品的優(yōu)惠信息缴守,刺激用戶消費葬毫,提高下單轉(zhuǎn)化率。
瀏覽量排名靠前的商品都不在銷量前20的商品中屡穗,僅更多地轉(zhuǎn)化為了收藏和加購數(shù)贴捡,說明這些商品在吸引用戶方面做的較好,但并沒有很好的轉(zhuǎn)化為實際銷量村砂。平臺可以對單銷量高或單瀏覽量高的商品群進一步分析其特征優(yōu)勢烂斋,從而交叉向有另一方面弱勢的商家推出對應(yīng)的增值指導(dǎo)服務(wù)。
在用戶購買的商品中础废,只購買1次的商品最多汛骂,占購買商品總數(shù)的82.77%,說明商品的銷售主要是依靠長尾商品的累計效應(yīng)评腺,而非爆款商品的帶動帘瞭。
銷量高的商品類別所包含的商品數(shù)也較多,因為銷量多的商品類別受用戶關(guān)注度高蒿讥,入駐的商家就會增多蝶念,各商家之間的產(chǎn)品相互替代性較高抛腕,這就形成了商品銷售的長尾現(xiàn)象。在平臺活動頁面媒殉,可以將銷量高的商品類別入口放在更顯眼的位置担敌,以更好地吸引用戶。
收獲
1廷蓉、體驗了一次比較完整的數(shù)據(jù)分析過程全封。鞏固了SQL和Python代碼知識、Excel作圖能力桃犬。尤其是數(shù)據(jù)清洗過程售貌,當(dāng)初覺得學(xué)的代碼還比較扎實,但在后面學(xué)習(xí)新知識的過程中還是會慢慢生疏疫萤,需要多實踐幾次才能印象更深刻。
2敢伸、明確分析目的扯饶、選對分析角度非常重要。如本文中數(shù)據(jù)集為淘寶全平臺的用戶數(shù)據(jù)池颈,則應(yīng)該站在淘寶平臺運營或同行業(yè)競爭對手的角度尾序,選擇分析方向,而不是站在某一淘寶商家的角度躯砰,導(dǎo)致分析結(jié)論一會是用于平臺的每币,一會是用于商家的,過于混亂琢歇。
3兰怠、指標(biāo)結(jié)合業(yè)務(wù)的深入理解很重要。在剛開始無從下手的時候會先了解一些行業(yè)常用的分析指標(biāo)體系李茫,看起來好像很簡單揭保,但在分析時一定要對每個指標(biāo)和指標(biāo)之間的關(guān)聯(lián)有正確和深刻的理解,才能夠選對合適的分析指標(biāo)魄宏,獲得正確的分析結(jié)果秸侣。還好對電商購物都是比較熟悉的,能夠結(jié)合自己的經(jīng)驗加入一些思考宠互,上面肯定還有很多理解有偏差的地方味榛,以后有了新的收獲會重新修改。
4予跌、寫文章的過程中一定要保持思路清晰搏色,對篩選出來的一堆指標(biāo)要做好恰當(dāng)?shù)姆诸悺⑴判蛉幔拍茏尫治龅哪繕?biāo)更加明確继榆,讓文章看起來有邏輯性巾表。