一、案例背景:
元?dú)夂Q笫且患乙远嗑S生素健康著稱的新型互聯(lián)網(wǎng)飲料企業(yè),旗下的甜茶掂恕、燒茶深受年輕人的喜愛(ài)。目前公司即將設(shè)計(jì)新一輪的電商活動(dòng)弛槐,元?dú)夂Q蟮倪\(yùn)營(yíng)負(fù)責(zé)人期望你協(xié)助他完成用戶行為分析懊亡,從去年的雙十一數(shù)據(jù)中,找到用戶購(gòu)物的高峰時(shí)間點(diǎn)乎串,從而設(shè)計(jì)對(duì)應(yīng)的運(yùn)營(yíng)節(jié)奏店枣。
二、分析具體問(wèn)題:
由于這一次要分析的數(shù)據(jù)體量上萬(wàn)叹誉,一打開(kāi)Excel就死機(jī)鸯两,所以需要使用Python來(lái)進(jìn)行相關(guān)的數(shù)據(jù)分析和可視化。
1长豁、在去年的11月钧唐,哪幾天是用戶瀏覽網(wǎng)頁(yè)的高峰期?
2匠襟、在一天中钝侠,什么時(shí)間點(diǎn)是用戶瀏覽網(wǎng)頁(yè)的高峰期?
3酸舍、在去年的11月帅韧,用戶瀏覽量和訪客數(shù)變化有什么關(guān)系(相關(guān)性)?
4啃勉、各個(gè)環(huán)節(jié)的轉(zhuǎn)化率怎么樣忽舟?
5、轉(zhuǎn)化率低是因?yàn)槟囊惶斓霓D(zhuǎn)化率有嚴(yán)重下滑淮阐?
三叮阅、具體代碼實(shí)現(xiàn)
1、在去年的11月枝嘶,哪幾天是用戶瀏覽網(wǎng)頁(yè)的高峰期帘饶?
結(jié)論:在去年的雙十一哑诊,雙十一這天是用戶瀏覽網(wǎng)頁(yè)的高峰期
2群扶、在一天中,什么時(shí)間點(diǎn)是用戶瀏覽網(wǎng)頁(yè)的高峰期?
結(jié)論:在一天中竞阐,0點(diǎn)缴饭、11-12點(diǎn)、18-21點(diǎn)是用戶瀏覽網(wǎng)頁(yè)的高峰期
3骆莹、在去年的11月颗搂,在去年的11月,用戶的訪客數(shù)情況
結(jié)論:在去年的11月幕垦,用戶的訪客數(shù)也是在雙十一這天最高
4丢氢、每一天中,不同時(shí)間段用戶的訪客數(shù)情況
結(jié)論:在一天中先改,0點(diǎn)疚察、11-12點(diǎn)、18-21點(diǎn)是訪客數(shù)的高峰期
5仇奶、在去年的11月貌嫡,用戶瀏覽量和訪客數(shù)變化有什么關(guān)系(相關(guān)性)?
結(jié)論:在一天中该溯,用戶瀏覽量和訪客數(shù)變化呈現(xiàn)強(qiáng)正相關(guān)岛抄,相關(guān)系數(shù)為0.98接近1,表明隨著訪客數(shù)越高瀏覽量也就越高
6狈茉、各個(gè)環(huán)節(jié)的轉(zhuǎn)化率怎么樣夫椭?
結(jié)論:從用戶行為轉(zhuǎn)化率中可以看出,瀏覽到點(diǎn)擊環(huán)節(jié)用戶流失較大氯庆,點(diǎn)擊環(huán)節(jié)的轉(zhuǎn)化率僅有0.09%益楼,需要優(yōu)化點(diǎn)擊環(huán)節(jié)
7、轉(zhuǎn)化率低是因?yàn)槟囊惶斓霓D(zhuǎn)化率有嚴(yán)重下滑
結(jié)論:整體點(diǎn)擊轉(zhuǎn)化率較低是因?yàn)殡p十一這天瀏覽量有了大幅度提升点晴,但是點(diǎn)擊量跟往日差不多感凤,導(dǎo)致雙十一這天點(diǎn)擊率大幅度下滑;
需要優(yōu)化雙十一活動(dòng)頁(yè)面粒督,因?yàn)榛顒?dòng)頁(yè)面內(nèi)容太多陪竿,顧客抓不住重點(diǎn),導(dǎo)致點(diǎn)擊量減少屠橄。
四族跛、得出結(jié)論
1、在去年的雙十一锐墙,雙十一這天是用戶瀏覽網(wǎng)頁(yè)的高峰期礁哄;在一天中,0點(diǎn)溪北、11-12點(diǎn)桐绒、18-21點(diǎn)是用戶瀏覽網(wǎng)頁(yè)的高峰期夺脾;在去年的11月,用戶的訪客數(shù)也是在雙十一這天最高茉继;在一天中咧叭,0點(diǎn)、11-12點(diǎn)烁竭、18-21點(diǎn)是訪客數(shù)的高峰期菲茬;在一天中,用戶瀏覽量和訪客數(shù)變化呈現(xiàn)強(qiáng)正相關(guān)派撕,相關(guān)系數(shù)為0.98接近1婉弹,表明隨著訪客數(shù)越高瀏覽量也就越高。
2终吼、雖然用戶瀏覽量和訪客數(shù)有較大提升马胧,但是最后的產(chǎn)品購(gòu)買量卻沒(méi)有較大提升,是因?yàn)椋簭挠脩粜袨檗D(zhuǎn)化率中可以看出衔峰,瀏覽到點(diǎn)擊環(huán)節(jié)用戶流失較大佩脊,點(diǎn)擊環(huán)節(jié)的轉(zhuǎn)化率僅有0.09%,需要優(yōu)化點(diǎn)擊環(huán)節(jié)垫卤;
整體點(diǎn)擊轉(zhuǎn)化率較低是因?yàn)殡p十一這天瀏覽量有了大幅度提升威彰,但是點(diǎn)擊量跟往日差不多,導(dǎo)致雙十一這天點(diǎn)擊率大幅度下滑穴肘;
需要優(yōu)化雙十一活動(dòng)頁(yè)面歇盼,因?yàn)榛顒?dòng)頁(yè)面內(nèi)容太多,顧客抓不住重點(diǎn)评抚,導(dǎo)致點(diǎn)擊量減少豹缀。
五、一點(diǎn)體會(huì)
學(xué)完P(guān)ython尤其是數(shù)據(jù)分析這塊慨代,真的可以幫助自己更快的處理數(shù)據(jù)邢笙,
1、其中可視化這塊兩個(gè)神庫(kù)matplotlib和seaborn侍匙,雖然seaborn可視化更高階氮惯,很多時(shí)候繪制圖形只需要一兩行代碼即可解決(如繪制折線圖直接用sns.lineplot(x=,y=,data=,color=))就能繪制出很漂亮的圖形,相比較pyplot更簡(jiǎn)單想暗,但是seaborn就類似套餐妇汗,很多時(shí)候不能自己選擇,比如:x軸標(biāo)簽说莫,圖形x,y軸標(biāo)題杨箭、圖形線型等屬性不能自己調(diào)整,pyplot雖然代碼多一些储狭,但是就類似自助餐互婿,自己要什么就取什么捣郊,而更加個(gè)性化,我還是喜歡用pyplot來(lái)進(jìn)行可視化擒悬。
2模她、還有就是pandas這個(gè)庫(kù)功能真的很強(qiáng)大稻艰,連透視表這個(gè)都可以實(shí)現(xiàn)(直接用pivot_table()即可)懂牧,查看數(shù)據(jù)的統(tǒng)計(jì)信息(比如均值、最大值尊勿、最小值等直接用describe()函數(shù)就能實(shí)現(xiàn))僧凤,連接兩個(gè)表不需要Excel復(fù)雜的vlookup操作,直接用concat([表名1,表名2])就可以元扔,去重的話直接用nunique()函數(shù)就能做到躯保,諸如此類,真是一入Python深似海澎语,愛(ài)到無(wú)法自拔~_~