一.項(xiàng)目背景
希望通過對(duì)數(shù)據(jù)中的信息進(jìn)行挖掘薯蝎,找出需要進(jìn)行改善的地方导而,針對(duì)性的采取措施,從而提高最后的產(chǎn)品銷量管挟。
本次所用數(shù)據(jù)集含訂單表及嬰幼兒信息表轿曙,數(shù)據(jù)集字段說明和示例數(shù)據(jù)分別如下所示:
訂單表:
嬰幼兒信息表:
二.分析思路
1.銷量隨時(shí)間的變化規(guī)律是怎樣的?
2.嬰兒年齡對(duì)產(chǎn)品銷量的影響僻孝?
3.嬰兒性別對(duì)產(chǎn)品銷量的影響导帝?
母嬰產(chǎn)品消費(fèi)人群的主要年齡段,銷量在性別之間是否有差異(用戶畫像)
母嬰產(chǎn)品年度及月度銷量趨勢(shì)(上新時(shí)間)
母嬰產(chǎn)品銷量TOP品類穿铆、單品您单,對(duì)應(yīng)的消費(fèi)人群(上新品類及單品)
母嬰產(chǎn)品中購買力最強(qiáng)的商品屬性關(guān)鍵詞(上新商品關(guān)鍵屬性)
三.數(shù)據(jù)分析
這里要分析銷量的各種關(guān)系,所以先對(duì)銷量數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗:從購買數(shù)據(jù)可以發(fā)現(xiàn)荞雏,平均購買量為2.5虐秦,這里最大購買數(shù)量居然達(dá)到了10000,所以購買數(shù)據(jù)中存在異常數(shù)據(jù)凤优,這里的處理方法是將超過平均值3倍標(biāo)準(zhǔn)差的異常數(shù)據(jù)進(jìn)行剔除悦陋,平均值為2.5,標(biāo)準(zhǔn)差為63筑辨,剔除購買數(shù)量大于191.5的數(shù)據(jù)俺驶。
1.嬰兒性別對(duì)銷量的影響
使用vlookup函數(shù),通過用戶id關(guān)聯(lián)棍辕,將baby的性別與訂單表匹配暮现。
由上餅圖可見,baby性別是男孩的用戶數(shù)量總體是大于女孩的楚昭,男孩是銷售數(shù)量總體也是大于女孩的送矩,銷售數(shù)量和用戶數(shù)量占比幾乎一致。
我們?cè)倏纯床煌詣e購買的最大數(shù)量:
通過對(duì)比數(shù)據(jù)可以看到哪替,男孩用戶有幾筆大額交易的購買數(shù)量栋荸,160件-25件,而女孩用戶的購買數(shù)量最大為13,因此晌块,這幾筆大的交易量使得男孩的購買量大于女孩的購買量爱沟,這里可以對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析,研究數(shù)據(jù)來源是否準(zhǔn)確匆背,到底是用戶本身造成的偏差呼伸,還是數(shù)據(jù)來源的問題。
結(jié)論:總體來看钝尸,baby的性別對(duì)銷量并沒有直接關(guān)系括享。
2,嬰兒年齡對(duì)銷售的影響
從數(shù)據(jù)透視結(jié)果看到珍促,0-1歲的年齡購買量最高铃辖,未出生到3歲的購買量占總購買量的80%以上。我們?cè)倏纯聪嗤詣e內(nèi)年齡分布對(duì)購買數(shù)量的影響:
從上圖中可以發(fā)現(xiàn)猪叙,無論男孩還是女孩娇斩,0-1歲的年齡購買量是最高的,男孩和女孩的年齡分布也是類似的穴翩。
結(jié)論:0-1歲的年齡購買量是最高的犬第,從圖中可以看出,不同產(chǎn)品即使銷量不同,但是趨勢(shì)類似,即隨著年齡的增加,商品的銷量出現(xiàn)了較為明顯的下降。
3.不同產(chǎn)品銷量分布情況
截取銷量前15名的單品訂單爆土,可以看出,50013636是熱銷單品,前三名單品分別是50013636,50010558,50013207家浇,銷量前15名的單品總銷售已經(jīng)占比40%本砰。
從圖中看出,排名前三的類目是5008168钢悲,50014815点额,28。
4.銷量隨著時(shí)間的趨勢(shì)變化
由圖看出整體銷量是每年遞增的莺琳,且每年內(nèi)的趨勢(shì)幾乎相同还棱,銷量在11月達(dá)到峰值。