淘寶用戶行為數(shù)據(jù)分析(MySQL+Excel)

這是第一次數(shù)據(jù)分析的實踐星持,選擇了比較經(jīng)典的淘寶用戶行為數(shù)據(jù)集抢埋,考慮到這個數(shù)據(jù)集比較大,能夠了解一下各種程序?qū)讉€G的數(shù)據(jù)文件的運行能力督暂。

本次分析主要分五個步驟進行:

理解數(shù)據(jù) →提出問題 →數(shù)據(jù)清洗 →建模分析 →總結(jié)建議

由于是先拿到數(shù)據(jù)集揪垄,再進行分析,所以此次分析的步驟為先理解數(shù)據(jù)损痰,再思考通過這樣一份數(shù)據(jù)的分析能夠獲得的對業(yè)務(wù)有用的信息福侈。

一、理解數(shù)據(jù)

數(shù)據(jù)來源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1

本數(shù)據(jù)集包含了2017年11月25日(周六)至2017年12月3日(周日)之間卢未,有行為的約一百萬隨機用戶的所有行為(行為包括點擊肪凛、購買、加購辽社、喜歡)伟墙。數(shù)據(jù)集的每一行表示一條用戶行為,由用戶ID滴铅、商品ID戳葵、商品類目ID、行為類型和時間戳組成汉匙,每一列的詳細(xì)描述如下:

列名稱 說明
user_id 整數(shù)類型拱烁,序列化后的用戶ID
item_id 整數(shù)類型,序列化后的商品ID
category_id 整數(shù)類型噩翠,序列化后的商品所屬類目ID
behavior 字符串戏自,枚舉類型,用戶行為類型伤锚,包括('pv','buy','cart','fav')
Timestamp 行為發(fā)生的時間戳

注意到擅笔,用戶行為類型共有四種,它們分別是

行為類型 說明
pv 商品詳情頁pv屯援,等價于點擊
buy 商品購買
cart 將商品加入購物車
fav 收藏商品
數(shù)據(jù)預(yù)覽

觀察數(shù)據(jù)猛们,這份數(shù)據(jù)集的分析報告對象應(yīng)該是淘寶的管理者,對于這份數(shù)據(jù)的分析主要應(yīng)該站在一個淘寶平臺數(shù)據(jù)運營的角度狞洋,思考這份數(shù)據(jù)對于業(yè)務(wù)的提升有什么作用弯淘,深度挖掘各數(shù)據(jù)指標(biāo)背后所隱藏的有用信息。


二吉懊、提出問題

1耳胎、數(shù)據(jù)集期間平臺的各項總體運營指標(biāo)(流量惯吕、轉(zhuǎn)化率等)如何?
2怕午、不同時間周期下的用戶行為有什么規(guī)律废登?如何利用這些規(guī)律?
3郁惜、基于AARRR模型分析每個環(huán)節(jié)的用戶運營情況堡距,提出改進建議。
4兆蕉、分析每個用戶獨特的行為偏好羽戒,考慮能夠提供怎樣的個性化的服務(wù)?
5虎韵、瀏覽易稠、收藏、加購物車包蓝、下單最多的商品分別是哪些驶社?相互之間有什么關(guān)聯(lián)?
6测萎、哪些商品類別的銷量較高亡电?有什么特征?


三硅瞧、數(shù)據(jù)清洗

  • 縮減數(shù)據(jù)集——數(shù)據(jù)抽樣
    由于原始數(shù)據(jù)1億多條記錄過于龐大份乒,直接導(dǎo)入MySQL數(shù)據(jù)庫太慢(使用Navicat Premium),本文選擇按照固定間距為30按順序抽取user_id中的部分用戶的行為數(shù)據(jù)腕唧,最終生成的數(shù)據(jù)表記錄為3308461條或辖。這一過程使用到了Python,順便添加了列標(biāo)題枣接,實現(xiàn)代碼如下:
import pandas as pd

file_path = "/Users/***/Desktop/UserBehavior.csv"
data = pd.read_csv(file_path,names = ['user_id','item_id','category_id','behavior','Timestamp'])

lst = list(range(1,1000000,30))

data2 = data[data['user_id'].isin(lst)]
data2.to_csv("/Users/***/Desktop/tb_user.csv",index=False)
  1. 導(dǎo)入數(shù)據(jù)庫

    先在數(shù)據(jù)庫中建好對應(yīng)表

    導(dǎo)入數(shù)據(jù)——選擇數(shù)據(jù)文件

    由于數(shù)據(jù)表中已有列標(biāo)題孝凌,將欄位名行改為1,第一行改為2月腋。

    導(dǎo)入成功,用時30s瓣赂。
  2. 選取子集

    只有5個字段榆骚,每個字段都具有分析意義,無需剔除煌集。

  3. 重復(fù)值處理

    本數(shù)據(jù)集中允許存在每個字段都完全相同的兩條記錄妓肢,理解為某一用戶在某一時間對數(shù)量為2的同一個商品進行的操作(例如在一單中購買兩個數(shù)量的某商品),因此無需刪除重復(fù)值苫纤。

  4. 缺失值處理

    數(shù)據(jù)導(dǎo)入時設(shè)置了NOT NULL碉钠,杜絕缺失值出現(xiàn)纲缓。

  5. 一致化處理
    • 添加date_time字段,將原Timestamp列時間戳轉(zhuǎn)換為日期+時間格式
    • 添加date字段喊废,提取date_time中的日期部分
    • 添加hour字段祝高,提取date_time中的小時部分
ALTER TABLE tb_user ADD COLUMN date_time datetime;
UPDATE tb_user SET date_time = FROM_UNIXTIME(`Timestamp`);

ALTER TABLE tb_user ADD COLUMN date date;
UPDATE tb_user SET date = DATE(date_time);

ALTER TABLE tb_user ADD COLUMN hour int;
UPDATE tb_user SET hour = EXTRACT(HOUR FROM date_time);

(這段代碼的執(zhí)行速度比較慢,300萬行的數(shù)據(jù)量會中斷連接1次污筷,需將UPDATE語句重復(fù)執(zhí)行兩次)

  1. 異常值處理

    6.1 在表界面工闺,點擊字段名稱后面的小箭頭,選擇升序和降序排序瓣蛀,查看user_id陆蟆、item_idcategory_id列無異常值惋增。

    6.2 date_time列按升序和降序排列后發(fā)現(xiàn)都有一些異常值叠殷。


    異常數(shù)據(jù)無法確認(rèn)真實時間,對超出本數(shù)據(jù)集時間范圍2017-11-25日至2017-12-03日之外的數(shù)據(jù)诈皿,全部作刪除處理林束,一共有2065條記錄。

    DELETE FROM tb_user
    WHERE date > '2017-12-03'
    OR date < '2017-11-25';
    


    6.3 檢查behavior列纫塌,無異常值

    SELECT * FROM tb_user
    WHERE behavior
    NOT IN ('pv','buy','cart','fav');
    

四诊县、建模分析

1. 總體運營指標(biāo)

總體運營指標(biāo)可以對一段時間內(nèi)平臺用戶使用的整體情況有一個宏觀的了解,通過與不同時期數(shù)據(jù)的縱向?qū)Ρ却胱螅梢缘贸鲞@段時期內(nèi)的整體運營情況好壞依痊。通過與同行業(yè)競爭者數(shù)據(jù)的橫向?qū)Ρ龋梢园l(fā)現(xiàn)自身平臺的優(yōu)勢與不足怎披。

  1. 1 流量類指標(biāo)
    • 獨立訪客總數(shù)uv
    • 頁面總訪問數(shù)pv
    • 人均頁面訪問數(shù)pv/uv
SELECT COUNT(DISTINCT user_id) as uv
    ,(SELECT COUNT(behavior) FROM tb_user WHERE behavior = 'pv') as pv
    ,(SELECT COUNT(behavior) FROM tb_user WHERE behavior = 'pv')/COUNT(DISTINCT user_id) as 'pv/uv'
FROM tb_user;
  1. 2 用戶行為轉(zhuǎn)化率——漏斗模型
-- 各種行為發(fā)生次數(shù)
SELECT behavior ,COUNT(behavior) as 次數(shù)
FROM tb_user
GROUP BY behavior
ORDER BY behavior DESC;

用戶在網(wǎng)上購物過程中收藏和加入購物車兩個環(huán)節(jié)沒有先后之分胸嘁,所以可以將這兩個環(huán)節(jié)合并為一個環(huán)節(jié)。
  • 可以看到凉逛,所有用戶從瀏覽到收藏+購物車的轉(zhuǎn)化率是9.39%性宏,從收藏+購物車到購買的轉(zhuǎn)化率是23.77%,最終從瀏覽到購買的訪問下單轉(zhuǎn)化率只有2.23%状飞,說明用戶花費了大量的時間瀏覽尋找合適的產(chǎn)品毫胜,這就需要優(yōu)化平臺的篩選功能,使用戶更容易找到合適的產(chǎn)品诬辈,提升使用體驗酵使。
  1. 3 跳失率
    跳失率 = 只點擊1次瀏覽的用戶數(shù)量/獨立訪客總數(shù)
-- 只點擊1次瀏覽用戶
SELECT t1.user_id ,behavior
FROM tb_user t1
INNER JOIN(
    SELECT user_id ,COUNT(behavior)
    FROM tb_user
    GROUP BY user_id
    HAVING COUNT(behavior) = 1) as t2
ON t1.user_id = t2.user_id
WHERE behavior = 'pv';
  • 如圖,查詢結(jié)果為空焙糟,跳失率是0口渔,所有的用戶在第一次瀏覽后又發(fā)生了其他的行為,說明淘寶擁有足夠的吸引力讓用戶停留在界面中穿撮。

2. 基于AARRR模型的用戶運營分析

  1. 1 用戶獲取
    本數(shù)據(jù)集中的用戶全部是已激活使用的用戶缺脉,此處用新增訪客數(shù)作為獲客能力的分析痪欲。淘寶本身用戶基數(shù)已經(jīng)比較大,由于數(shù)據(jù)集期間較短攻礼,新增訪客可能主要是一段時間未使用的用戶业踢,也會有少數(shù)新注冊用戶,此處統(tǒng)一作為新用戶看待秘蛔。
-- 日新增訪客數(shù)
SELECT 日期 ,COUNT(user_id) as 新增訪客數(shù)
FROM (SELECT user_id ,MIN(date) as 日期
      FROM tb_user
      GROUP BY user_id) as s1
GROUP BY 日期;
  • 2017年11月25日是第一天陨亡,新增訪客數(shù)沒有參考意義。從第二天開始分析深员,后面幾天新增訪客數(shù)快速減少负蠕,12月2日和3日甚至零新增,平臺獲客能力大大下降倦畅。最后兩天的訪客數(shù)大幅增加遮糖,說明主要是前幾日流失的客戶受活動吸引,又重新回來消費了叠赐,活動完全沒有吸引到新用戶欲账。后期需要加強平臺的渠道曝光量和活動宣傳范圍,設(shè)置長期未使用用戶的專屬優(yōu)惠券或新客專享優(yōu)惠以吸引新用戶芭概。
  1. 2 提高活躍度
    1. 2.1 不同日期的用戶活躍規(guī)律
SELECT `date`
       ,COUNT(DISTINCT user_id) as 訪客數(shù)
       ,SUM(CASE WHEN behavior = 'pv' THEN 1 ELSE 0 END) as 點擊
       ,SUM(CASE WHEN behavior = 'fav' THEN 1 ELSE 0 END) as 收藏
       ,SUM(CASE WHEN behavior = 'cart' THEN 1 ELSE 0 END) as 加購物車
       ,SUM(CASE WHEN behavior = 'buy' THEN 1 ELSE 0 END) as 購買
FROM tb_user
GROUP BY `date`;

  • 從圖中可以得出如下結(jié)論:
    1赛不、日點擊量和日訪客數(shù)的趨勢有高度相關(guān)性;
    2罢洲、從2017年11月25日~2017年12月1日的一周內(nèi)踢故,各項指標(biāo)都沒有明顯的波動,周末與工作日沒有太大區(qū)別惹苗。點擊殿较、收藏、加購物車次數(shù)在周一至周四略低于周五至周日桩蓉,購買次數(shù)則相反淋纲,說明用戶在空閑時間充足的時候更喜歡瀏覽和挑選,在工作期間則更有下單的沖動院究;
    3洽瞬、同樣是周末,2017年12月2日~2017年12月3日的各項數(shù)據(jù)比起上個周末有了明顯的增加业汰,可能是在這兩天做了活動伙窃;
    4、日人均頁面訪問量基本持平蔬胯,在13±0.5之間波動,說明周末和平臺活動都對人均頁面訪問量沒有顯著的影響位他,要提高流量數(shù)據(jù)主要還是在于增加訪客數(shù)氛濒。

    1. 2.2 一天內(nèi)不同時間的用戶行為分析
SELECT `hour`
       ,SUM(CASE WHEN behavior = 'pv' THEN 1 ELSE 0 END) as 點擊
       ,SUM(CASE WHEN behavior = 'fav' THEN 1 ELSE 0 END) as 收藏
       ,SUM(CASE WHEN behavior = 'cart' THEN 1 ELSE 0 END) as 加購物車
       ,SUM(CASE WHEN behavior = 'buy' THEN 1 ELSE 0 END) as 購買
FROM tb_user
GROUP BY `hour`;
  • 可以看出产场,用戶每天0點~8點睡眠時間活躍度較低,白天9點~18點都保持在一個較為平穩(wěn)的中等活躍度水平舞竿,從19點開始京景,活躍度迅速上升,21~22點達到頂峰骗奖,之后回落确徙。說明用戶喜歡在晚上下班至睡覺前的時間段內(nèi)逛淘寶,在這段時間推送一些短信或系統(tǒng)通知可以更容易地吸引用戶進入淘寶使用执桌。
  • 此外鄙皇,用戶購買次數(shù)在白天和傍晚差不多,說明人們多數(shù)會在晚上逛淘寶挑選商品仰挣,在白天下單伴逸。可以將一些下單優(yōu)惠(如淘金幣抵扣)膘壶,或用戶收藏和購物車內(nèi)商品的相關(guān)通知放在白天推送错蝴,提升用戶下單轉(zhuǎn)化率。還可以建議商家把一天的發(fā)貨時間設(shè)在18點以后颓芭,以減少用戶等待發(fā)貨的時間顷锰,提升用戶使用體驗度。
  1. 3 用戶留存
    計算用戶留存率較為復(fù)雜亡问,分為四個步驟:
    第一步:獲取每個用戶第一次使用的日期
    第二步:計算每個用戶之后每次使用與第一次使用日期的間隔天數(shù)
    第三步:匯總每日新增用戶不同間隔天數(shù)的留存人數(shù)
    第四步:計算每日留存率
SELECT firstday
      ,day0 as 新增用戶
      ,CONCAT(ROUND(day1/day0*100,2),'%') as 'day1_%'
      ,CONCAT(ROUND(day2/day0*100,2),'%') as 'day2_%'
      ,CONCAT(ROUND(day3/day0*100,2),'%') as 'day3_%'
      ,CONCAT(ROUND(day4/day0*100,2),'%') as 'day4_%'
      ,CONCAT(ROUND(day5/day0*100,2),'%') as 'day5_%'
      ,CONCAT(ROUND(day6/day0*100,2),'%') as 'day6_%'
      ,CONCAT(ROUND(day7/day0*100,2),'%') as 'day7_%'
      ,CONCAT(ROUND(day8/day0*100,2),'%') as 'day8_%'
FROM(
SELECT firstday
      ,SUM(CASE WHEN days_diff = 0 THEN 1 ELSE 0 END) as day0
      ,SUM(CASE WHEN days_diff = 1 THEN 1 ELSE 0 END) as day1
      ,SUM(CASE WHEN days_diff = 2 THEN 1 ELSE 0 END) as day2
      ,SUM(CASE WHEN days_diff = 3 THEN 1 ELSE 0 END) as day3
      ,SUM(CASE WHEN days_diff = 4 THEN 1 ELSE 0 END) as day4
      ,SUM(CASE WHEN days_diff = 5 THEN 1 ELSE 0 END) as day5
      ,SUM(CASE WHEN days_diff = 6 THEN 1 ELSE 0 END) as day6
      ,SUM(CASE WHEN days_diff = 7 THEN 1 ELSE 0 END) as day7
      ,SUM(CASE WHEN days_diff = 8 THEN 1 ELSE 0 END) as day8
FROM(
SELECT t1.user_id ,t1.date ,t2.firstday ,DATEDIFF(t1.date,t2.firstday) as days_diff
FROM tb_user as t1
INNER JOIN (SELECT user_id ,MIN(`date`) as firstday
            FROM tb_user
            GROUP BY user_id) as t2
ON t1.user_id = t2.user_id
GROUP BY t1.user_id,t1.date
) as t3
GROUP BY firstday
) as t4
GROUP BY firstday;
  • 可以看出屉凯,每一期的用戶留存率都比較穩(wěn)定,沒有隨著時間的推移而衰減溉瓶,說明留存用戶對淘寶的使用粘性非常高伤疙;
  • 最后兩日沒有新增用戶,活動吸引的主要是前幾日的老用戶慎框,兩天活動期間的留存率達到了95%以上良狈,有20%~30%是因為活動而回流,說明老用戶對于活動的關(guān)注度和參與度都非常高笨枯。
  1. 4 用戶收益
    1. 4.1 付費用戶占比PUR
-- 總消費人數(shù)
SELECT COUNT(DISTINCT user_id) as 總消費人數(shù)
FROM tb_user
WHERE behavior = 'buy';

付費用戶占比 = 總消費人數(shù)/獨立訪客總數(shù) = 22017/32366*100% = 68.03%

  • 使用淘寶的用戶中有68%都產(chǎn)生了購買行為薪丁,用戶付費轉(zhuǎn)化率相當(dāng)高。

    1. 4.2 復(fù)購率
      -- 不同消費次數(shù)的人數(shù)
SELECT buy_times
      ,COUNT(user_id) as 人數(shù)
FROM(
     SELECT user_id
         ,COUNT(behavior) as buy_times
     FROM tb_user
     WHERE behavior = 'buy'
     GROUP BY user_id
     ) as t1
GROUP BY buy_times;
  • 消費1次的人數(shù)占比 = 7335/22017*100% = 33.32%
  • 復(fù)購率 = 1 - 消費1次的人數(shù)占比 = 66.68%
    由此可知馅精,在有購買行為的用戶中严嗜,有66.68%的用戶會再次發(fā)生購買行為,復(fù)購率比較高洲敢。另外消費次數(shù)大部分集中在10次以內(nèi)漫玄,占總消費人數(shù)的97.80%,消費1次的人數(shù)最多,占總消費人數(shù)的1/3睦优。最高消費次數(shù)可達53次渗常,需重點關(guān)注高消費頻率客戶的客戶價值。

3. 單用戶行為分析

-------- 針對每個用戶提供個性化服務(wù)

  1. 1 單用戶商品偏好分析
    -- 用戶瀏覽商品所屬類目排名
SELECT user_id ,category_id ,COUNT(behavior) as view_times
FROM tb_user
WHERE behavior = 'pv'
GROUP BY user_id ,category_id
ORDER BY user_id ,view_times DESC;
  • 用戶瀏覽某個類目下的商品次數(shù)較多時汗盘,說明他可能是在同一類目下的不同商品之間挑選皱碘,此時可以根據(jù)該用戶瀏覽商品類目次數(shù)的排名,在推薦頁面優(yōu)先推薦瀏覽次數(shù)多的類目下的其他商品隐孽。
  1. 2 單用戶購買偏好
    -- 用戶收藏或加入購物車了癌椿,但是沒有購買的商品
SELECT t1.user_id ,t1.item_id
FROM(
    SELECT user_id ,item_id
    FROM tb_user
    WHERE behavior = 'fav'
    OR behavior = 'cart'
    GROUP BY user_id,item_id
    ) as t1
LEFT JOIN(
    SELECT user_id ,item_id
    FROM tb_user
    WHERE behavior = 'buy'
    GROUP BY user_id,item_id
    ) as t2
ON t1.user_id = t2.user_id
AND t1.item_id = t2.item_id
WHERE t2.user_id IS NULL;
  • 用戶對收藏或加入購物車的商品購買意愿是比較強烈的,可能因為某些原因還沒有成交菱阵。針對這些商品有針對性地給用戶推出一些優(yōu)惠活動踢俄,可以提高這些用戶下單的概率。

4. 商品相關(guān)分析

  1. 1 不同行為的商品排名分析
    -- 商品銷量前20(其他排名代碼類似)
SELECT item_id ,count(behavior) AS '銷售量'
FROM tb_user
WHERE behavior = 'buy'
GROUP BY item_id
ORDER BY 銷售量 DESC
LIMIT 20;
  • 銷量最高的商品是item_id為3122135的商品送粱,購買次數(shù)有37次褪贵,排在第二和第三位的商品購買次數(shù)均為33次。


  • 在瀏覽量前20的商品中抗俄,只有3個商品銷量較高脆丁,瀏覽量前6名的商品都不在銷量榜單中,說明這些商品在吸引用戶方面做的較好动雹,但并沒有很好的轉(zhuǎn)化為實際銷量槽卫。



  • 收藏數(shù)前20的商品也僅有740947和1535294的銷量排名較高,但收藏數(shù)前幾位的商品與瀏覽量前幾名重合度較高胰蝠,說明瀏覽量高的商品收藏轉(zhuǎn)化率也較高歼培。


  • 加購數(shù)前20的商品中,有5個進入了銷量前20茸塞,且集中排列在銷量第4位至第9位之間躲庄,說明銷量與加購數(shù)的關(guān)系更為密切。

  • 總的來說钾虐,做的最好的商品是1535294噪窘,各項指標(biāo)都排在靠前的位置,將高瀏覽量成功地轉(zhuǎn)化為了收藏和加購數(shù)效扫,進而轉(zhuǎn)化為銷量倔监,可以作為一個典型的例子推廣學(xué)習(xí)。對其他單銷量高或單瀏覽量高的商品群可以進一步分析其特征優(yōu)勢菌仁,從而交叉向有另一方面弱勢的商家推出對應(yīng)的增值指導(dǎo)服務(wù)浩习。

  1. 2 商品購買次數(shù)分布
    -- 計算不同購買次數(shù)的商品數(shù)各有多少個
SELECT 購買次數(shù) ,COUNT(item_id) as 商品數(shù)
FROM (SELECT item_id ,COUNT(behavior) as 購買次數(shù)
      FROM tb_user
      WHERE behavior = 'buy'
      GROUP BY item_id) as buy_times
GROUP BY 購買次數(shù);
  • 只購買1次的商品最多,有42118個济丘,占購買商品總數(shù)的82.77%谱秽,購買兩次的商品有5902個,占比11.60%,說明商品的銷售主要是依靠長尾商品的累計效應(yīng)疟赊,而非爆款商品的帶動辱士。
  1. 3 商品類別偏好
    -- 計算不同類別下商品的總銷量以及包含的商品數(shù),按銷量排序
SELECT t1.category_id
      ,t2.sales
      ,COUNT(distinct t1.item_id) as item_num
FROM tb_user t1
JOIN (SELECT category_id ,COUNT(*) as sales
      FROM tb_user
      WHERE behavior = 'buy'
      GROUP BY category_id) as t2
ON t1.category_id = t2.category_id
GROUP BY category_id
ORDER BY sales DESC;
  • 如圖听绳,銷量最高的幾個商品類別總銷量均在1000個左右,且有一個共同特征——所包含的商品數(shù)都很多异赫,這也比較好理解椅挣,銷量多的商品類別受用戶關(guān)注度高,入駐的商家就會增多塔拳,各商家之間的產(chǎn)品相互替代性較高鼠证,這就形成了商品銷售的長尾現(xiàn)象。在平臺活動頁面靠抑,可以將銷量高的商品類別入口放在更顯眼的位置量九,以更好地吸引用戶。

五颂碧、總結(jié)建議

  1. 用戶從瀏覽到收藏+購物車的轉(zhuǎn)化率是9.39%荠列,從收藏+購物車到購買的轉(zhuǎn)化率是23.77%,訪問下單轉(zhuǎn)化率只有2.23%载城,說明用戶花費了大量的時間瀏覽尋找合適的產(chǎn)品肌似。需要優(yōu)化平臺的篩選和推薦功能,使用戶更容易找到合適的產(chǎn)品诉瓦,提升使用體驗川队。

  2. 基于AARRR模型的分析結(jié)論
    (1)用戶獲取:數(shù)據(jù)集期間每日新增訪客數(shù)快速減少睬澡,平臺活動也完全沒有吸引到新用戶固额。淘寶本身用戶基數(shù)已經(jīng)比較大,獲取新注冊用戶的邊際成本太高煞聪,要提高訪客數(shù)應(yīng)更重視休眠用戶的激活斗躏。后期需要加強平臺的渠道曝光量和活動宣傳范圍,設(shè)置長期休眠用戶的激活優(yōu)惠券或新客專享優(yōu)惠以吸引新增用戶米绕。
    (2)提高活躍度:
    ①用戶使用淘寶的頻率在工作日與周末的差別不大瑟捣,周末和平臺活動都對日人均頁面訪問量沒有顯著的影響,要提高流量數(shù)據(jù)主要還是在于增加訪客數(shù)栅干。在周末推出一些優(yōu)惠活動能顯著地提高用戶的活躍度迈套。
    ②在一天之內(nèi),用戶更喜歡在晚上下班至睡覺前的時間內(nèi)逛淘寶碱鳞,在19點之后開始推送一些短信或系統(tǒng)通知可以更容易地吸引客戶使用淘寶桑李。白天9點~18點的時間段內(nèi)則可以多推送一些下單優(yōu)惠,或用戶收藏和購物車內(nèi)商品的相關(guān)通知,提升用戶下單轉(zhuǎn)化率贵白。
    (3)用戶留存:淘寶用戶的留存率比較高且比較穩(wěn)定率拒,留存用戶使用粘性非常強,通過適當(dāng)?shù)赝瞥龌顒幽軌蜻_到95%以上的留存率禁荒。
    (4)用戶收益:用戶付費轉(zhuǎn)化率可達到68%猬膨,付費用戶中有復(fù)購行為的用戶又占到了66.68%,說明用戶整體的消費能力相當(dāng)強呛伴。針對消費頻率較高的客戶勃痴,需重點關(guān)注其客戶價值,了解用戶的偏好和需求热康,提供諸如會員服務(wù)等更加個性化的服務(wù)以維持客戶沛申。
    (5)傳播推薦:從新增訪客數(shù)來看,淘寶用戶的自傳播能力較差姐军,可以通過設(shè)置聯(lián)合使用優(yōu)惠券或推薦新客獎勵铁材,提高用戶傳播率。

  3. 用戶個性化服務(wù)方面奕锌,根據(jù)用戶瀏覽商品類目次數(shù)的排名著觉,可以在推薦頁面提供更加個性化的推薦服務(wù),優(yōu)先推薦瀏覽次數(shù)多的類目下的其他商品惊暴。對于用戶收藏或加入了購物車固惯,還沒有購買的商品,可以向用戶推送一些商品的優(yōu)惠信息缴守,刺激用戶消費葬毫,提高下單轉(zhuǎn)化率。

  4. 瀏覽量排名靠前的商品都不在銷量前20的商品中屡穗,僅更多地轉(zhuǎn)化為了收藏和加購數(shù)贴捡,說明這些商品在吸引用戶方面做的較好,但并沒有很好的轉(zhuǎn)化為實際銷量村砂。平臺可以對單銷量高或單瀏覽量高的商品群進一步分析其特征優(yōu)勢烂斋,從而交叉向有另一方面弱勢的商家推出對應(yīng)的增值指導(dǎo)服務(wù)。

  5. 在用戶購買的商品中础废,只購買1次的商品最多汛骂,占購買商品總數(shù)的82.77%,說明商品的銷售主要是依靠長尾商品的累計效應(yīng)评腺,而非爆款商品的帶動帘瞭。

  6. 銷量高的商品類別所包含的商品數(shù)也較多,因為銷量多的商品類別受用戶關(guān)注度高蒿讥,入駐的商家就會增多蝶念,各商家之間的產(chǎn)品相互替代性較高抛腕,這就形成了商品銷售的長尾現(xiàn)象。在平臺活動頁面媒殉,可以將銷量高的商品類別入口放在更顯眼的位置担敌,以更好地吸引用戶。


收獲

1廷蓉、體驗了一次比較完整的數(shù)據(jù)分析過程全封。鞏固了SQL和Python代碼知識、Excel作圖能力桃犬。尤其是數(shù)據(jù)清洗過程售貌,當(dāng)初覺得學(xué)的代碼還比較扎實,但在后面學(xué)習(xí)新知識的過程中還是會慢慢生疏疫萤,需要多實踐幾次才能印象更深刻。

2敢伸、明確分析目的扯饶、選對分析角度非常重要。如本文中數(shù)據(jù)集為淘寶全平臺的用戶數(shù)據(jù)池颈,則應(yīng)該站在淘寶平臺運營或同行業(yè)競爭對手的角度尾序,選擇分析方向,而不是站在某一淘寶商家的角度躯砰,導(dǎo)致分析結(jié)論一會是用于平臺的每币,一會是用于商家的,過于混亂琢歇。

3兰怠、指標(biāo)結(jié)合業(yè)務(wù)的深入理解很重要。在剛開始無從下手的時候會先了解一些行業(yè)常用的分析指標(biāo)體系李茫,看起來好像很簡單揭保,但在分析時一定要對每個指標(biāo)和指標(biāo)之間的關(guān)聯(lián)有正確和深刻的理解,才能夠選對合適的分析指標(biāo)魄宏,獲得正確的分析結(jié)果秸侣。還好對電商購物都是比較熟悉的,能夠結(jié)合自己的經(jīng)驗加入一些思考宠互,上面肯定還有很多理解有偏差的地方味榛,以后有了新的收獲會重新修改。

4予跌、寫文章的過程中一定要保持思路清晰搏色,對篩選出來的一堆指標(biāo)要做好恰當(dāng)?shù)姆诸悺⑴判蛉幔拍茏尫治龅哪繕?biāo)更加明確继榆,讓文章看起來有邏輯性巾表。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市略吨,隨后出現(xiàn)的幾起案子集币,更是在濱河造成了極大的恐慌,老刑警劉巖翠忠,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鞠苟,死亡現(xiàn)場離奇詭異,居然都是意外死亡秽之,警方通過查閱死者的電腦和手機当娱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來考榨,“玉大人跨细,你說我怎么就攤上這事『又剩” “怎么了冀惭?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長掀鹅。 經(jīng)常有香客問我散休,道長,這世上最難降的妖魔是什么乐尊? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任戚丸,我火速辦了婚禮,結(jié)果婚禮上扔嵌,老公的妹妹穿的比我還像新娘限府。我一直安慰自己,他們只是感情好痢缎,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布谣殊。 她就那樣靜靜地躺著,像睡著了一般牺弄。 火紅的嫁衣襯著肌膚如雪姻几。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天势告,我揣著相機與錄音蛇捌,去河邊找鬼。 笑死咱台,一個胖子當(dāng)著我的面吹牛络拌,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播回溺,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼春贸,長吁一口氣:“原來是場噩夢啊……” “哼混萝!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起萍恕,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤逸嘀,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后允粤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體崭倘,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年类垫,在試婚紗的時候發(fā)現(xiàn)自己被綠了司光。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡悉患,死狀恐怖残家,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情售躁,我是刑警寧澤坞淮,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站迂求,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏晃跺。R本人自食惡果不足惜揩局,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望掀虎。 院中可真熱鬧凌盯,春花似錦、人聲如沸烹玉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽二打。三九已至县忌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間继效,已是汗流浹背症杏。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留瑞信,地道東北人厉颤。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像凡简,于是被迫代替她去往敵國和親逼友。 傳聞我的和親對象是個殘疾皇子精肃,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345