基于MySQL的淘寶用戶購物行為的分析

數(shù)據(jù)來源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46(阿里云天池)

一遣鼓、分析目的與主要指標

我們的目的是查看雙十一之后1個月的用戶購物情況,主要有以下指標

1. 日常訪問量

2. 購物點擊總體情況:用戶總訪問量PV涕刚、 收藏次數(shù)、購物車加入數(shù)簇捍、購買次數(shù)只壳;

3. 購物行為轉化率與行為轉化漏斗;

4. 用戶總數(shù)暑塑、下單購買人數(shù)與用戶轉化率吼句;

5. 回頭客與復購情況;

6. 查看點擊與購買次數(shù)最多/最少的客戶情況

7. 查看用戶購物活躍 時間

8. 查看用戶對商品的喜好

二事格、數(shù)據(jù)解析

表名:tianchi_user, 合計1048675行數(shù)據(jù)惕艳,共有6列/字段:

user_id:用戶編碼

item_id:商品編碼

behavior_type:用戶行為分類(1點擊,2收藏驹愚,3加入購物車远搪,4下單購買四種)

user_geohash:地理位置(無效NULL值過多,無法有效分析逢捺,隱藏或刪除此列)

item_category:商品的類別代號

time:用戶行為發(fā)生的日期時間

三谁鳍、數(shù)據(jù)整理

去重后,將該CSV文件導入Navicat

1.查看完整性劫瞳,處理缺失值

除了user_geohash已經(jīng)被隱藏/刪除/或不被導入即可倘潜,導入檢查其他5列,確認數(shù)據(jù)完整志于,無需填補涮因。

2. 分列時間

表中time 字段日期和小時合在一起,不便分析伺绽,把該字段拆分為 2 個字段养泡,一個日期+一個小時列。

-- 重命名 time 字段名稱為 date

ALTER TABLE ?tianchi_user CHANGE time date VARCHAR(255)?

-- 添加 time 列

ALTER TABLE tianchi_user ADD time VARCHAR(20);

-- 復制 date 列到 time 列

UPDATE ?tianchi_user SET time=date;

-- 在 date 列截饶斡Α(年-月-日)信息

UPDATE ?tianchi_user? SET date=REPLACE(date,date,SUBSTRING_INDEX(date,' ',1));

-- 在 time 列截取小時信息

UPDATE ?tianchi_user? SET time=REPLACE(time,time,SUBSTRING_INDEX(time,' ',-1));


拆分后表格如下:

3.把用戶行為behavior_type(1點擊澜掩,2收藏,3加入購物車钥组,4下單購買四種)改為便于識別的代號

UPDATE tianchi_user

SET behavior_type=REPLACE(behavior_type,1,'PV');

UPDATE?tianchi_user

SET behavior_type=REPLACE(behavior_type,2,'Like');

UPDATE?tianchi_user

SET behavior_type=REPLACE(behavior_type,3,'Add');

UPDATE?tianchi_user

SET behavior_type=REPLACE(behavior_type,4,'Buy');

修改后如下:

四输硝、數(shù)據(jù)查詢分析

1.日常點擊量

從圖中可以看出,雙十一之后那一個月每天的訪問量都是比較平穩(wěn)的程梦,周末沒有明顯差別。一般維持在25000-30000之間橘荠,而雙12前一天開始增加屿附,當天則是翻倍的情況

2.總體情況:點擊量PV總訪問量、 購物車數(shù)量哥童、收藏次數(shù)挺份、購買次數(shù)

初步觀察:點擊量很大而加入購物的人數(shù)卻才到點擊量的3%,這里有待觀察贮懈,可以繼續(xù)看具體的行為轉化率匀泊。

SELECT behavior_type, COUNT(*)

FROM tianchi_user

GROUP BY behavior_type;

3.用戶行為轉化率情況:漏斗模型(tableau)

從下圖中可以看出优训,PV占了總行為數(shù)的94%,而添加購物車只占3%各聘,而最后實際購買的在1%揣非,所以從點擊到添加購物車這一步,轉化最低 躲因,流失很多早敬。

原因猜想:

1)推薦的商品不到位用戶沒興趣,推薦算法有待改進大脉,

2)頁面不明確搞监,分類不清,用戶難以到達自己想要的商品子類別镰矿,

3)商品搜索關鍵字關聯(lián)度不足琐驴,用戶難以搜到自己想要的商品。

4.凈點擊用戶量UV秤标,凈購買用戶數(shù)量绝淡,客戶轉化率

由下圖,總客戶有8500抛杨,最后購買的有4300够委,總體轉化率接近51%,沒有行業(yè)對比怖现,暫時不清楚情況是好是差茁帽。

SELECT COUNT(DISTINCT user_id) AS '用戶總數(shù)' FROM tianchi_user;

#查詢下單購買用戶量

SELECT COUNT(DISTINCT user_id) AS '下單購買用戶量' FROM tianchi_user

WHERE behavior_type = 'Buy';

創(chuàng)建視圖

CREATE VIEW behavior_temp?AS

SELECT user_id, count(behavior_type) as '行為次數(shù)小計',

SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END) AS '點擊次數(shù)',

SUM(CASE WHEN behavior_type='Like' THEN 1 ELSE 0 END) AS '收藏次數(shù)',

SUM(CASE WHEN behavior_type='Add' THEN 1 ELSE 0 END) AS '購物車數(shù)',

SUM(CASE WHEN behavior_type='Buy' THEN 1 ELSE 0 END) AS '購買次數(shù)'

FROM tianchi_user

GROUP BY user_id

ORDER BY COUNT(behavior_type) DESC;

-- DROP VIEW behavior_temp

#查看用戶購物情況視圖

SELECT * FROM behavior_temp

5.查詢購買用戶數(shù)量、重復購買用戶數(shù)量以及復購率

回頭客近50%屈嗤,也還需要對比潘拨,才知道是好是差。

#查詢用戶復購率

SELECT SUM(CASE WHEN 購買次數(shù)>=2 THEN 1 ELSE 0 END) AS '復購用戶',

SUM(CASE WHEN 購買次數(shù)>0 THEN 1 ELSE 0 END) AS '總購用戶',

CONCAT(ROUND(SUM(CASE WHEN 購買次數(shù)>=2 THEN 1 ELSE 0 END)/SUM(CASE WHEN 購買次數(shù)>0 THEN 1 ELSE 0 END)*100), '%') AS '復購率'

FR?OM behavior_temp

6.#查看購買次數(shù)多的用戶情況饶号,及其購買率

1)點擊量不大铁追、購買次數(shù)多的用戶,購物目的相對比較明確茫船,一般是剛需琅束,這種客戶點擊次數(shù)/收藏次數(shù)都較少而購買率自然就上去了,這種大概適合繼續(xù)維護算谈,不易開發(fā)

2)點擊量大涩禀,購買次數(shù)多的用戶,一般是理性偏熱衷購物的用戶然眼,這大概是我們的重點維護艾船,適當開發(fā)的對象

SELECT user_id, 點擊次數(shù), 收藏次數(shù), 購物車數(shù), 購買次數(shù),

CONCAT(ROUND(購買次數(shù)/點擊次數(shù)*100, 2),'%') AS '購買率'

FROM behavior_temp

GROUP BY user_id

ORDER BY 購買次數(shù) DESC;

3)購買次數(shù)少點擊少的用戶,我們琢磨不透建議繼續(xù)觀察或放棄;

4)購買次數(shù)少屿岂,點擊次數(shù)多的用戶可能是選擇困難癥或是十分精明克制的客戶践宴,這種是否可以通過優(yōu)惠活動或精準營銷推送吸引其關注,重點開發(fā)爷怀。

SELECT user_id, 點擊次數(shù), 收藏次數(shù), 購物車數(shù), 購買次數(shù),

CONCAT(ROUND(購買次數(shù)/點擊次數(shù)*100, 2),'%') AS '購買率'

FROM behavior_temp

GROUP BY user_id

ORDER BY 購買次數(shù) ASC;

7.#查看每天用戶活躍時段

晚上8點到10點是用戶購物活躍的高峰阻肩,所以在流量容量的分配,以及晚上客服的排班上可以有所擴張霉撵。在這個時段有效運用活動推廣磺浙。

SELECT time, count(behavior_type) as '行為次數(shù)小計',

SUM(CASE WHEN behavior_type='PV' THEN 1 ELSE 0 END) AS '點擊次數(shù)',

SUM(CASE WHEN behavior_type='Like' THEN 1 ELSE 0 END) AS '收藏次數(shù)',

SUM(CASE WHEN behavior_type='Add' THEN 1 ELSE 0 END) AS '購物車數(shù)',

SUM(CASE WHEN behavior_type='Buy' THEN 1 ELSE 0 END) AS '購買次數(shù)'

FROM tianchi_user

GROUP BY time

ORDER BY COUNT(behavior_type) DESC;

7.#查看用戶對商品的喜好,以點擊量為基準

#查看用戶點擊最多的商品類別

SELECT item_category, COUNT(item_category) AS '商品類別點擊量'

FROM tianchi_user

WHERE behavior_type = 'PV'

GROUP BY item_category

ORDER BY 商品類別點擊量 DESC;

點擊最多的類別為1863徒坡,前6類商品的點擊量均已超過2萬撕氧,后續(xù)直線下降。


#查看用戶點擊最多商品名稱

SELECT item_category, item_id, COUNT(item_id) AS '商品點擊量'

FROM tianchi_user

WHERE behavior_type = 'PV'

GROUP BY item_id

ORDER BY 商品點擊量 DESC;

點擊量最多的商品為112921337喇完,可以看到點擊量最多的商品并不在點擊最多的商品類別里面伦泥,這很正常,可以猜測用戶在尋找這幾個商品時都很明確锦溪。

五不脯、總結問題與改善建議

1、整體上用戶行為轉化率近1%刻诊,主要在用戶點擊后加入購物車或收藏的這一環(huán)節(jié)轉換率過低防楷,可通過精準營銷或作活動引流,增強商品關鍵字搜索關聯(lián)性等等手段提高用戶轉化则涯。

2复局、購買次數(shù)多的用戶,購買率較高粟判,同時點擊量并不高亿昏,說明他們購物目標明確,很有可能是剛需档礁,這些用戶需要保持就好角钩;購買次數(shù)多,點擊量也多的用戶可能是理性消費用戶需要重點維護呻澜,適當開發(fā)递礼。

購買次數(shù)少點擊少的用戶,我們琢磨不透建議繼續(xù)觀察或放棄羹幸;購買次數(shù)少宰衙,點擊次數(shù)多的用戶可能是選擇困難癥或是十分精明克制的客戶,這種是否可以通過活動或精準營銷推送吸引其關注睹欲,重點開發(fā)。

3、用戶日尘酱活躍度通常都比較平穩(wěn)袋哼,維持在25000-30000之間。在一天中闸衫,用戶在晚上8--11點最為活躍涛贯,這個時段網(wǎng)站流量,促銷活動蔚出,客服支持等等可以向此傾斜弟翘。

4、用戶點擊最多的6類商品均已突破2萬骄酗,初步預測那六類商品用戶需求較大稀余,而點擊最多的具體商品112921337,用戶點擊前4的商品對應的類別不在點擊最多的商品類別里面趋翻,說明這個類別的商品睛琳,用戶尋找的目的比較明確。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末踏烙,一起剝皮案震驚了整個濱河市师骗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌讨惩,老刑警劉巖辟癌,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異荐捻,居然都是意外死亡黍少,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進店門靴患,熙熙樓的掌柜王于貴愁眉苦臉地迎上來仍侥,“玉大人,你說我怎么就攤上這事鸳君∨┰ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵或颊,是天一觀的道長砸紊。 經(jīng)常有香客問我,道長囱挑,這世上最難降的妖魔是什么醉顽? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮平挑,結果婚禮上游添,老公的妹妹穿的比我還像新娘系草。我一直安慰自己,他們只是感情好唆涝,可當我...
    茶點故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布找都。 她就那樣靜靜地躺著,像睡著了一般廊酣。 火紅的嫁衣襯著肌膚如雪能耻。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天亡驰,我揣著相機與錄音晓猛,去河邊找鬼。 笑死凡辱,一個胖子當著我的面吹牛戒职,可吹牛的內容都是我干的。 我是一名探鬼主播煞茫,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼帕涌,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了续徽?” 一聲冷哼從身側響起蚓曼,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎钦扭,沒想到半個月后纫版,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡客情,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年其弊,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片膀斋。...
    茶點故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡梭伐,死狀恐怖,靈堂內的尸體忽然破棺而出仰担,到底是詐尸還是另有隱情糊识,我是刑警寧澤,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布摔蓝,位于F島的核電站赂苗,受9級特大地震影響,放射性物質發(fā)生泄漏贮尉。R本人自食惡果不足惜拌滋,卻給世界環(huán)境...
    茶點故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望猜谚。 院中可真熱鬧败砂,春花似錦赌渣、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至祭隔,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間路操,已是汗流浹背疾渴。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留屯仗,地道東北人搞坝。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像魁袜,于是被迫代替她去往敵國和親桩撮。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,781評論 2 354

推薦閱讀更多精彩內容