對本階段進行總結(jié)
第五階段學習的內(nèi)容已經(jīng)是業(yè)務知識,業(yè)務知識個人認為需要通過多看書反惕、多做項目和參與實際的工作才會更加熟練昌渤。
利用第五階段的BlackFriday案例,在工具應用方面椎侠,再次加深了匿名函數(shù)第租、apply函數(shù)和seaborn模塊的理解,明白了實際運用的意義和使用方法我纪。工具應用方面也在做案例的同時不斷熟悉慎宾,感覺提升了一定的獨立分析的能力(工具應用+業(yè)務知識);
在業(yè)務知識方面浅悉,對電商簡單宏觀指標熟悉了趟据,也熟悉了數(shù)據(jù)背后的含義,以及得出結(jié)論的思路术健。
分析框架:
1.整體簡要的銷售情況汹碱;
2.用戶畫像描繪與分析(分析最高價值的消費者群體,從年齡荞估、性別咳促、婚姻狀況色难、職業(yè)、以及由性別等缀、婚姻狀況和年齡組成的維度枷莉,共五個維度進行分析)
3.對產(chǎn)品進行銷售情況的分析(總體:高價值產(chǎn)品;細化:銷售額Top10尺迂,銷售量Top10笤妙,產(chǎn)品的類別;)
4.從城市的維度對銷售情況進行分析
分析工具:
主體:python噪裕;模塊:pandas蹲盘、numpy、seaborn膳音、matplotlib召衔;可視化:python
一、整體簡要的銷售情況
1.數(shù)據(jù)導入與簡要探索
(1)引入本次分析所需要的用的模塊祭陷。為了方便后面的分析苍凛,利用魔法函數(shù)matplotlib inline讓圖表直接渲染;利用rcParms函數(shù)增加圖表的可讀性兵志;
(2)讀取數(shù)據(jù)醇蝴,并查看表基本情況,如:查看表想罕、字段類型悠栓、了解字段含義、表的大小按价,數(shù)據(jù)缺失情況惭适。
該表由537577行數(shù)據(jù)和12列的字段構(gòu)成,產(chǎn)品二級分類和三級分類出現(xiàn)數(shù)據(jù)缺失情況楼镐。
2.整體簡要的銷售情況
1.查看相關指標:總銷售額癞志、總銷量、總購買(消費)人數(shù)鸠蚪、人均消費今阳、所有產(chǎn)品平均客單價
描述型統(tǒng)計:1.該電商此次黑色星期五促銷活動的銷售額達到了50億美元师溅;
2.人均消費85萬美元茅信,購買人數(shù)為5891人,客單價在9333美元
分析:不到6000人的消費者墓臭,人均消費達到了85萬美元蘸鲸,說明參與本次促銷活動的消費者都是擁有高消費能力的大客戶。該平臺需要把握好其中的忠實用戶窿锉,并引導消費酌摇。
二膝舅、用戶畫像描繪與分析
1.年齡維度
按年齡分組,通過聚合函數(shù)和匿名函數(shù)()對各指標進行運算窑多。其中仍稀,消費人數(shù)的計算需要定義一個函數(shù)進行運算,通過運用drop_duplicates()函數(shù)對User_ID進行去重埂息,從而得出整體人數(shù)技潘,通過for循環(huán)對不同年齡層的群體進行區(qū)分。其他指標計算都運用匿名函數(shù)lambda()千康,通過apply()函數(shù)進行映射享幽,提高數(shù)據(jù)提取的效率
分析:由上述數(shù)據(jù)可知:1.總體來說,18-45歲的消費者貢獻了最多的消費額拾弃,為39億美元值桩,占比超過76%;同時豪椿,該年齡層的消費者人數(shù)達到了4289人奔坟,占比超過71%。從數(shù)據(jù)上來看搭盾,該年齡層的消費者是本次促銷活動的主要消費者蛀蜜!2.其中,26-35的消費者尤為突出增蹭,消費額貢獻將近40%滴某,消費人數(shù)占比34%。在消費人數(shù)排在第一位的情況下滋迈,客單價也排在了第一位霎奢,達到了97萬美元,是擁有高消費能力和高消費意愿的群體饼灿,可以考慮向該群體精準推送高價值的產(chǎn)品幕侠。
2.性別維度
按性別對數(shù)據(jù)進行分組,指標計算
方法同上
分析:男性消費者為本次促銷活動的主要消費用戶碍彭,消費額占比達到76%晤硕,是女性消費額的2.5倍,消費人數(shù)占比也達到71%庇忌,是女性消費人數(shù)的2倍左右舞箍;同樣地,高消費人數(shù)情況下皆疹,客單價遠高于女性消費者疏橄,達到了91萬美元。男性消費者消費能力和消費意愿都明顯高于女性消費者,可以考慮向男性消費者進行個性化推廣捎迫,選擇高價值的產(chǎn)品進行促銷晃酒。
3.婚姻狀況維度
按婚姻狀況對數(shù)據(jù)進行分組,指標計算方法同上
分析:從得出的數(shù)據(jù)可知窄绒,已婚消費者和未婚消費者在消費額和客單價的差異并不明顯贝次,已婚消費者的消費人數(shù)相差1000左右,可能是消費人數(shù)的差異使消費額和客單價出現(xiàn)差距彰导∽巧粒總的來說,已婚消費者和未婚消費者在各指標的差異并不大螺戳,說明單靠婚姻狀況維度可能對分析的幫助并不大
4.職業(yè)維度
按職業(yè)列對數(shù)據(jù)進行分組搁宾,指標計算方法同上
分析:職業(yè)為4、0倔幼、7的消費群體在銷售額和消費人數(shù)都位列前三位盖腿,三者的差異并不大,共貢獻了35%的銷售額损同,以及占消費人數(shù)的34%翩腐。這些職業(yè)的消費者應該屬于高價值消費者,應該加大關注膏燃。
5.性別茂卦、年齡、婚姻狀態(tài)組成的維度
新增數(shù)據(jù)列gender_mstatus组哩,用于合并性別與婚姻狀況等龙,按gender_mstatus和年齡對數(shù)據(jù)進行分組,指標計算方法同上
可視化展示:利用seaborn模塊伶贰,快速創(chuàng)建直方圖蛛砰,對數(shù)據(jù)進行可視化,更加直觀地呈現(xiàn)數(shù)據(jù)
(1)查看消費額
分析:1.總體來說黍衙,男性是本次促銷活動的主要消費者泥畅,貢獻了絕大部分的銷售額。其中琅翻,18-45歲的消費者是消費的主體位仁;2.在年齡在18-45歲的消費者中,未婚男性消費者是消費的主體方椎;3.26-35歲的未婚男性消費者在本次促銷活動貢獻銷售額方面尤其突出聂抢;
(2)查看消費人數(shù)
分析:1.未婚男性是消費人數(shù)最多的消費群體,已婚男性排在第二位辩尊;2.大多數(shù)消費者的年齡層都集中在18-46歲涛浙,以未婚男性為主;3.26-35歲的未婚男性是參與本次促銷活動最多的消費群體摄欲,應該是該電商的忠實用戶轿亮;
三、產(chǎn)品銷售情況
1.產(chǎn)品維度
按產(chǎn)品進行分組胸墙,利用聚合函數(shù)計算銷售額我注、銷售額占比、銷量迟隅、銷量占比但骨、客單價;找出銷售額Top10智袭、銷量Top10奔缠,以及銷售額和銷量都為Top10的產(chǎn)品
分析:1.銷售額Top10的產(chǎn)品為熱銷商品,銷量Top10的商品的最受歡迎商品吼野;2.銷售額和銷量同時為Top10的商品需要好好關注校哎,監(jiān)控庫存情況,防止斷貨瞳步;
2.產(chǎn)品分類維度
由于二級分類和三級分類的數(shù)據(jù)存在缺失情況闷哆,只有一級分類為完整數(shù)據(jù),所以在這里僅對一級分類進行分析单起。
按一級分類分組抱怔,利用聚合函數(shù)計算銷售額、銷售額占比嘀倒、銷量屈留、銷量占比、客單價测蘑;找出銷售額前三和倒數(shù)前三的商品類別绕沈。
分析:1.在本次促銷活動中,商品一級分類的1帮寻、5乍狐、8類商品的銷售額位于前三位,銷售額超過了36.5億美金固逗,三者一共貢獻了超過71%的消費額浅蚪;同時,三者一共貢獻了39.9萬的銷量烫罩,共占比72%惜傲,屬于熱銷商品和最受歡迎商品類別;
2.商品一級分類中13贝攒、12盗誊、17商品的銷售額分別位于尾三位,在400萬-570萬美金之間,三者一共僅貢獻了0.2%的消費額;
四哈踱、城市銷售情況
按城市進行分組荒适,利用聚合函數(shù)計算銷售額、銷售額占比开镣、銷量刀诬、銷量占比、客單價
分析:1.B城市的銷售額最高邪财,達到了20億美元陕壹,占比40%;
2.C城市的消費人數(shù)最多树埠,為3139人糠馆,占比53%,但銷售額和客單價卻并沒有高于B城市怎憋,說明該城市的消費者購買的產(chǎn)品的價格相對較低又碌;
3.另外A城市的消費人數(shù)雖為最低,但客單價高于B城市盛霎,說明了A城市擁有較高的消費能力赠橙;
4.綜上所述,A愤炸、B城市消費者的消費能力應該是最高的期揪,可以考慮向該城市的消費者推銷價格較高的產(chǎn)品;C城市的消費能力可能較弱规个,考慮向該城市推銷單價較低的產(chǎn)品凤薛,爭取增加銷量
總結(jié)
從用戶的角度,由消費者畫像的方面進行分析:
1.由上述數(shù)據(jù)和可視化圖表可得诞仓,26-35歲缤苫,職業(yè)分別為4、0墅拭、7活玲、1的未婚男性為本次促銷活動的主要消費群體,是擁有高消費能力和高消費意愿的高消費群體谍婉,是該電商的超級忠實用戶舒憾;
建議:需要對這部分用戶更加精準的個性化營銷,留存好這類客戶穗熬,在銷售中為其提供高價值的產(chǎn)品镀迂;
2.對于其他用戶來說,依然需要做好運營唤蔗,引導其購買熱銷產(chǎn)品探遵;
從產(chǎn)品的角度分析:
描述型統(tǒng)計:
1.在本次促銷活動中窟赏,商品一級分類的1、5箱季、8類商品的銷售額位于前三位涯穷,銷售額超過了36.5億美金,三者一共貢獻了超過71%的消費額规哪;同時求豫,三者一共貢獻了39.9萬的銷量塌衰,共占比72%诉稍,屬于熱銷商品和最受歡迎商品類別;
2.商品一級分類中13最疆、12杯巨、17商品的銷售額分別位于尾三位,在400萬-570萬美金之間努酸,三者一共僅貢獻了0.2%的消費額;
建議:
(1)1服爷、5、8類商品的陳列位置從數(shù)據(jù)上來看應該是擁有最多流量的获诈,可以通過這些位置對其他商品進行引流仍源;
(2)需要查明排在尾三位的商品類別,即13舔涎、12笼踩、17類商品銷售額占比過低的原因,若沒有合適的解決方案亡嫌,可以考慮商品下架或者減少關于這些類別的商品的陳列面積和降低引流(廣告)費用嚎于;
(3)可以把其他商品的銷售與1、5挟冠、8類別的商品捆綁起來銷售于购,皆在以熱銷、受歡迎商品帶動其他商品的流量和銷售知染;
3.從城市的維度進行分析:
1.B城市作為消費能力最強的城市肋僧,需要在該城市提前準備足夠的產(chǎn)品庫存。
2.商品類別1控淡、5嫌吠、7作為最受歡迎的熱銷產(chǎn)品,需要在各城市的準備足夠的產(chǎn)品庫存逸寓,尤其在B城市居兆;
3.監(jiān)控庫存情況,預防熱銷產(chǎn)品斷貨