背景介紹
淘寶是中國深受歡迎的電商平臺擅憔,經(jīng)常網(wǎng)購的人少不了逛逛淘寶,隨便看看有什么想買的或者有目的想買什么倍阐,在逛淘寶的過程中概疆,我們會留下足跡。通過這些足跡峰搪,也就是用戶的行為岔冀,我們可以對這些行為進行分析挖掘。
使用的工具是Python概耻,主要用到了Numpy使套,Pandas、Matplotlib及Msno這幾個包鞠柄。
數(shù)據(jù)來源于阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46
1 提出問題
本文主要圍繞這幾個點展開:
1.漏斗模型用戶行為分析
2.平臺用戶使用情況分析
3.時間維度用戶行為分析
4.RFM模型用戶價值分析
5.商品銷售情況分析
6.商品銷售類目分析
2 數(shù)據(jù)讀取與數(shù)據(jù)探索
2.1 數(shù)據(jù)說明
數(shù)據(jù)集包含了2014年11月18日至2014年12月18日之間侦高,有行為的約100萬隨機用戶的所有行為(行為包括點擊、購買厌杜、加購奉呛、喜歡)。
數(shù)據(jù)主要包括5個字段期奔,用戶ID侧馅,商品ID危尿,商品類目ID呐萌,行為類型,時間戳谊娇。一共有12256906條記錄肺孤。
2.2 數(shù)據(jù)讀取
總共的數(shù)據(jù)有1億左右,雖然pandas可以處理這么多的數(shù)據(jù)济欢,但是電腦配置不夠赠堵,所以這里只取了1200多萬條數(shù)據(jù)。使用pandas讀取數(shù)據(jù)只需要幾秒鐘的時間法褥,Excel大半天都打不開茫叭。
2.3 數(shù)據(jù)探索
查看數(shù)據(jù)信息
1200多萬的數(shù)據(jù)大小有561.1M,要是全部數(shù)據(jù)大小差不多有4G
查看是否有缺失值
user_geohash 缺失值過多半等,需做剔除處理
3 數(shù)據(jù)清洗
3.1 刪除重復(fù)值
3.2 處理缺失值
3.3 數(shù)據(jù)一致性轉(zhuǎn)換
4 數(shù)據(jù)分析
4.1 漏斗模型用戶行為分析
a.上述分析說明揍愁,需要優(yōu)化商品的推薦機制呐萨,優(yōu)化用戶搜索商品的效率;
b.提升用戶從點擊到收藏和加入購物車這一環(huán)節(jié)的轉(zhuǎn)化率莽囤,這樣才能最終提升用戶購買的比例谬擦。
4.2?平臺用戶使用情況分析
4.3?時間維度用戶行為分析
可以發(fā)現(xiàn)在雙十二當(dāng)天訪問量達(dá)到頂峰,可以利用這個巨大的流量優(yōu)勢朽缎,提升用戶購買的幾率惨远。
分別分析瀏覽和其他三種行為在一天的變化情況,可以發(fā)現(xiàn):
a.用戶從0點到6點處于一個休息狀態(tài)话肖,而從6點開始北秽,到10點活躍的人數(shù)越來越多,10點達(dá)到了一個巔峰最筒,然后又逐漸回落羡儿,預(yù)測是用戶起床上班,利用路上通勤時間進行瀏覽以及購買是钥,而到了上班時間掠归,則只能抽空購物;
b.晚上6點到12點用戶數(shù)量又開始激增悄泥,成交率也增加虏冻,證明用戶下班,吃飯等等有較多的空閑時間進行購物了弹囚,22點之后瀏覽慢慢下降厨相,是準(zhǔn)備要休息了。
在用戶的空閑時間安排營銷活動鸥鹉,比如早上通勤時間蛮穿,中午吃飯時間,晚上6-10點毁渗,能夠提升用戶成交率践磅。
4.4?RFM模型用戶價值分析
最近一次消費 (Recency)
消費頻率 (Frequency)
消費金額 (Monetary)
a.重要價值用戶是優(yōu)質(zhì)客戶,可以有針對性地給這類客戶提供VIP服務(wù)灸异,比如現(xiàn)在的淘寶VIP會員卡等等府适;
b.重要挽留客戶占比也很大,他們消費時間間隔較遠(yuǎn)肺樟,并且消費頻次低檐春,需要主動聯(lián)系客戶,調(diào)查清楚哪里出現(xiàn)了問題么伯,比如通過短信疟暖,郵件,APP推送等喚醒客戶;
c.重要保持客戶俐巴,消費時間間隔較遠(yuǎn)朋贬,但是消費頻次高,有可能就是需要買東西的時候窜骄,就高頻購買锦募,不需要就不再購物,對于這類客戶邻遏,需要主動聯(lián)系糠亩,了解客戶的需求,及時滿足這類用戶的需求(提供優(yōu)惠券促使消費)准验;
d.重要發(fā)展客戶赎线,消費頻次低,我們需要提升他的消費頻率糊饱,可以通過優(yōu)惠券疊加等活動來刺激消費垂寥。
4.5?商品銷售情況分析
大量商品只被購買一次
用戶瀏覽的商品和最終購買的商品存在著很大的差異,我們需要優(yōu)化推薦系統(tǒng)另锋,讓用戶真正找到自己想買的商品滞项,將瀏覽量轉(zhuǎn)換為購買量。
從瀏覽到加購/收藏的轉(zhuǎn)化率較低夭坪。
收藏之后購買的高于加入購物車之后被購買的轉(zhuǎn)化率文判。
a.收藏是比加購有更高轉(zhuǎn)化率的途徑,可以針對收藏夾的商品發(fā)放優(yōu)惠券室梅,促使轉(zhuǎn)化戏仓;
b.用戶收藏和加入購物車之后的購買率達(dá)到了35.8%,說明商品只要被用戶喜歡和加入購物車亡鼠,那就有相當(dāng)大的幾率被購買赏殃,所以我們應(yīng)該采取相應(yīng)措施,比如讓客戶去收藏和加入購物車间涵,這樣能夠增大轉(zhuǎn)化率仁热。
4.6?商品銷售類目分析
a.可以嘗試將銷量較低的商品和銷量較高的商品捆綁銷售,并且優(yōu)化商品的展示浑厚,將暢銷類的商品和非暢銷品展示在一起股耽,提升商品購買轉(zhuǎn)化率;
b.優(yōu)化商品的推薦算法钳幅,將流量更多地聚焦于暢銷的商品,打造爆款的產(chǎn)品炎滞,并利用爆款產(chǎn)品帶動整體商品類目的銷售敢艰。
5 結(jié)論
1.需要優(yōu)化商品的推薦機制,優(yōu)化用戶搜索商品的效率册赛,提升用戶從點擊到收藏和加入購物車這一環(huán)節(jié)的轉(zhuǎn)化率钠导,這樣才能最終提升用戶購買的比例震嫉;
2.有過購買行為的用戶占總用戶的比例為88.8%,需要采取措施引流牡属;
3.雙十二當(dāng)天訪問量達(dá)到頂峰票堵,可以利用這個巨大的流量優(yōu)勢,提升用戶購買的幾率逮栅。在用戶的空閑時間安排營銷活動悴势,比如早上通勤時間,中午吃飯時間措伐,晚上6-10點特纤,能夠提升用戶成交率;
4.大量商品只被購買一次侥加,用戶瀏覽的商品和最終購買的商品存在著很大的差異捧存,我們需要優(yōu)化推薦系統(tǒng),讓用戶真正找到自己想買的商品担败,將瀏覽量轉(zhuǎn)換為購買量昔穴;
5.收藏是比加購有更高轉(zhuǎn)化率的途徑,可以針對收藏夾的商品發(fā)放優(yōu)惠券提前,促使轉(zhuǎn)化傻咖。用戶收藏和加入購物車之后的購買率達(dá)到了35.8%,說明商品只要被用戶喜歡和加入購物車岖研,那就有相當(dāng)大的幾率被購買卿操,所以我們應(yīng)該采取相應(yīng)措施,比如讓客戶去收藏和加入購物車孙援,這樣能夠增大轉(zhuǎn)化率害淤;
6.可以嘗試將銷量較低的商品和銷量較高的商品捆綁銷售,并且優(yōu)化商品的展示拓售,將暢銷類的商品和非暢銷品展示在一起窥摄,提升商品購買轉(zhuǎn)化率。優(yōu)化商品的推薦算法础淤,將流量更多地聚焦于暢銷的商品崭放,打造爆款的產(chǎn)品,并利用爆款產(chǎn)品帶動整體商品類目的銷售鸽凶。