淘寶母嬰商品分析報告
一、項(xiàng)目背景及目的
隨著電商行業(yè)的迅速發(fā)展册着,其內(nèi)部競爭也越發(fā)激烈拴孤,商家店鋪為了更好地提升銷售量,應(yīng)當(dāng)逐漸改變運(yùn)營思維甲捏,通過銷售數(shù)據(jù)去了解市場演熟,了解用戶,從而制定精準(zhǔn)的營銷策略司顿。本文以阿里天池母嬰用品銷售數(shù)據(jù)為例芒粹,通過產(chǎn)品和用戶兩個方面去分析母嬰用品銷售情況,得出結(jié)論大溜,為商家提出針對性地建議化漆。
二、分析思路及內(nèi)容
本文分析內(nèi)容主要分為兩部分:產(chǎn)品方面和用戶方面钦奋。產(chǎn)品方面主要分析了母嬰用品總體的銷售情況座云,并對各類產(chǎn)品進(jìn)行了細(xì)分,為商家備貨選擇付材、促銷推廣提供了依據(jù)朦拖,最后借助邏輯樹分析母嬰用品銷量提升的影響因素,為商家提供銷售改進(jìn)策略厌衔。用戶方面主要驗(yàn)證嬰兒年齡及性別對產(chǎn)品銷售量的影響贞谓,為商家進(jìn)行精準(zhǔn)營銷提供依據(jù)。
三葵诈、數(shù)據(jù)處理
3.1數(shù)據(jù)說明
本文數(shù)據(jù)來源為阿里天池母嬰用品銷售數(shù)據(jù)裸弦,數(shù)據(jù)地址為:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
數(shù)據(jù)集中包含兩個數(shù)據(jù)表,分別為商品銷售數(shù)據(jù)和嬰兒信息作喘,其中指標(biāo)具體含義如下所示:
user_id 用戶身份信息(作為用戶唯一標(biāo)識)
action_id 購買行為編號
cat_id 商品種類(對應(yīng)具體的商品種類)
cat1 商品類別(購買商品的類別)
property 商品屬性(具體分類信息)
buy_mount 購買數(shù)量
day 購買時間
user_id 用戶身份信息(作為用戶唯一標(biāo)識)
birthday 嬰兒生日
gender 嬰兒性別
商品銷售數(shù)據(jù)共計(jì)29972條采盒,時間跨度從2012.年7月2日到2015年2月5日蜓堕,嬰兒信息共計(jì)953條
為了可以更好地理解數(shù)據(jù)信息,我們對數(shù)據(jù)集中的指標(biāo)進(jìn)行重命名,具體如表所示:
user_id 用戶ID
action_id 訂單ID
cat_id 商品ID
cat1 商品類別ID
property 商品屬性
buy_mount 購買數(shù)量
day 訂單日期
user_id 用戶ID
birthday 嬰兒生日
gender 嬰兒性別
3.2數(shù)據(jù)清洗
本文使用Excel表格工具對相關(guān)數(shù)據(jù)進(jìn)行清洗孵运,分別進(jìn)行檢查缺失值、刪除重復(fù)值伦忠、數(shù)據(jù)一致化處理等操作固以。
3.2.1檢查缺失值
商品銷售數(shù)據(jù)表中共計(jì)樣本數(shù)29972條,利用COUNTA函數(shù)對各指標(biāo)樣本數(shù)進(jìn)行統(tǒng)計(jì)豌熄,具體數(shù)據(jù)如表所示:
指標(biāo)字段 樣本計(jì)數(shù)
用戶ID 29972
訂單ID 29972
商品ID 29972
商品品類ID 29972
商品屬性 29828
購買數(shù)量 29972
訂單日期 29972
從表中可以看出商品銷售數(shù)據(jù)各指標(biāo)字段中商品屬性指標(biāo)中存在缺失值授嘀,缺失個數(shù)為144,缺失率為0.48%锣险,因?yàn)樯唐穼傩灾笜?biāo)中的數(shù)據(jù)為編碼形式蹄皱,對銷售數(shù)據(jù)相關(guān)分析沒有影響,因此本文用0進(jìn)行填充芯肤。
嬰兒信息數(shù)據(jù)表中共計(jì)樣本數(shù)953條巷折,利用COUNTA函數(shù)對各指標(biāo)樣本數(shù)進(jìn)行統(tǒng)計(jì),具體數(shù)據(jù)如表所示:
指標(biāo)字段 樣本計(jì)數(shù)
用戶ID 953
嬰兒生日 953
嬰兒性別 953
從表中可以看出在嬰兒信息數(shù)據(jù)表中崖咨,各指標(biāo)字段的樣本數(shù)量均為953條锻拘,不存在缺失值。
3.2.2刪除重復(fù)值
為了對母嬰商品銷售數(shù)據(jù)進(jìn)行有效地分析击蹲,本文對母嬰商品銷售數(shù)據(jù)進(jìn)行去重操作署拟,考慮到同一個用戶可能會重復(fù)下單,本文采取用戶ID+訂單ID為去重字段际邻,利用Excel數(shù)據(jù)欄目中“刪除重復(fù)值”功能進(jìn)行去重操作芯丧,沒有發(fā)現(xiàn)重復(fù)值。
3.3.3數(shù)據(jù)一致化處理
在母嬰商品銷售數(shù)據(jù)和嬰兒信息兩個數(shù)據(jù)表中都涉及到了日期數(shù)據(jù)世曾,但原數(shù)據(jù)中日期數(shù)據(jù)為一串?dāng)?shù)字缨恒,為了將其轉(zhuǎn)換為日期數(shù)據(jù),本文利用Excel數(shù)據(jù)欄目中的“分列”功能轮听,將其中的日期元素分離出來骗露,從而實(shí)現(xiàn)了數(shù)據(jù)格式的轉(zhuǎn)化。
3.3數(shù)據(jù)整合
為了方便對母嬰商品銷售數(shù)據(jù)進(jìn)行用戶特征分析血巍,本文利用VLOOKUP函數(shù)以用戶ID為主鍵將母嬰商品銷售數(shù)據(jù)和嬰兒信息兩個數(shù)據(jù)表結(jié)合起來萧锉,建立商品銷售-嬰兒信息匹配表。在建立匹配表的過程中發(fā)現(xiàn)述寡,商品銷售數(shù)據(jù)中的部分用戶沒有注冊嬰兒信息柿隙,為了保證數(shù)據(jù)的完整性叶洞,本文將缺失數(shù)據(jù)進(jìn)行了刪除操作。同時使用IF和DATEDIF函數(shù)計(jì)算嬰兒的年齡禀崖,并進(jìn)行分組操作衩辟,其具體函數(shù)形式為:IF(G2>H2,DATEDIF(H2,G2,"Y")+1,-1),其中對于那些提前備貨的用戶的嬰兒年齡標(biāo)注為-1波附,表示提前備貨艺晴。在嬰兒信息原數(shù)據(jù)中,嬰兒性別為0掸屡、1和2封寞,本文使用IF函數(shù)對嬰兒的性別進(jìn)行標(biāo)注,0代表女孩仅财,1代表男孩狈究,2代表未知,可能是用戶注冊時沒有填寫满着,其中性別未知的樣本量為26谦炒,數(shù)據(jù)量較小,對相關(guān)分析影響不大风喇,為了保證分析的有效性宁改,本文選擇將其刪除,最后整理好的匹配表形式如圖所示:
4產(chǎn)品層面分析
通過時間序列分析魂莫、多維度分析还蹲、對比分析、邏輯樹分析等多種分析方法對母嬰商品銷售數(shù)據(jù)進(jìn)行分析耙考,主要從母嬰用品整體銷售量變化趨勢谜喊、不同類別商品細(xì)分、銷售量變化因素探析三個方面進(jìn)行倦始。
4.1母嬰用品整體銷售量變化趨勢分析
通過時間序列分析法對母嬰商品銷售量進(jìn)行年斗遏、季度兩個維度的趨勢分析。
(1)年度分析
從圖1中可以看出鞋邑,2012年到2015年母嬰銷售量呈現(xiàn)先增后降的趨勢诵次,但其中2012年和2015年的銷售數(shù)據(jù)不完整,只有一部分枚碗,因此不做過多對比逾一。其中,2013年全年母嬰商品銷售量為22813件肮雨,2014年全年母嬰商品銷售量為42241件遵堵,銷量增長了19428件,增長幅度為85.2%。這可能是因?yàn)榛ヂ?lián)網(wǎng)經(jīng)濟(jì)發(fā)展良好陌宿,拉動了網(wǎng)上購物的銷量锡足。
(2)季度分析
從圖2中可以看出,不同季度的商品銷量有很大的差別壳坪,其中第四季度銷量最高舱污,第四季度的銷量占全年總銷量的41.4%,而在第四季度中弥虐,11月的銷量是最高的,占第四季度銷量的55.9%媚赖,占全年銷量的23.2%霜瘪。這是由于第四季度臨近年底,各種節(jié)日增多惧磺,商家會推出大量的促銷活動颖对,刺激消費(fèi)者消費(fèi),從而拉升銷量磨隘,同時11月份有淘寶平臺進(jìn)行的“11.11”購物節(jié)活動缤底,這種平臺性的促銷活動也極大地拉升了商品的銷量。這就導(dǎo)致全年第四季度銷量相對較高番捂,而其他季度銷量則相對平均个唧,從圖3中也可以看出母嬰商品銷量的波動變化。
4.2不同類別商品銷量分析
將商品進(jìn)行細(xì)分设预,分析不同類別商品的銷售數(shù)據(jù)徙歼,判斷哪些商品屬于熱賣產(chǎn)品,哪些商品屬于滯銷產(chǎn)品鳖枕,幫助商家改進(jìn)進(jìn)貨策略魄梯。
從圖4中可以看出,整個母嬰商品共分6個類別宾符,其中銷量排名前三的分別是28酿秸、50014815、50008168三類商品魏烫,這三類商品銷量占比分別為37%辣苏、26%、25%则奥。
另一方面考润,商品總銷量=購買次數(shù)×單次購買量,從購買次數(shù)和單次購買量兩個方面分析不同類別商品的特征读处,其中28糊治、50014815兩類商品屬于購買次數(shù)少,單次購買量大的商品罚舱,商家對于這兩類商品應(yīng)該進(jìn)行組合銷售井辜,提高單次成交額绎谦,而50008168這類商品屬于購買次數(shù)多,單次購買量少的商品粥脚,對于這類商品商家應(yīng)該進(jìn)行長期促銷活動窃肠,提高消費(fèi)者購買次數(shù),進(jìn)而提高銷售量刷允,如圖6所示冤留。
4.3商品銷售量變化因素分析
本文使用對比分析法、邏輯樹分析法對母嬰商品銷售數(shù)據(jù)變化因素進(jìn)行分析树灶,由于2012年纤怒、2015年兩年數(shù)據(jù)不完整,因此只分析2013年和2014年的數(shù)據(jù)天通。從之前的分析中得出泊窘,2014年商品銷售量比2013年的銷售數(shù)據(jù)有了很大的提升,我們利用邏輯樹法對銷售量影響因素進(jìn)行分析像寒。從分析思路圖中可以看出烘豹,對銷售影響因素我們主要從用戶、產(chǎn)品诺祸、用戶行為三個方面進(jìn)行了分解携悯。
(1)用戶方面
在用戶方面,本文假設(shè)是新用戶的增加和老用戶復(fù)購率增加提升了銷售量序臂。通過對用戶ID篩選重復(fù)值蚌卤,來確定重復(fù)購物的老用戶,在2013年和2014年都有過消費(fèi)行為的即為老用戶奥秆,統(tǒng)計(jì)之后發(fā)現(xiàn)逊彭,2013年和2014年的老用戶僅有5位,而2013年到2014年新增用戶有5271位构订,因此可以確定2014年的銷量提升侮叮,主要原因是新用戶的大幅度增加。
(2)產(chǎn)品方面
在產(chǎn)品方面悼瘾,本文假設(shè)銷量提升是因?yàn)榇罅啃缕飞霞芎驮猩唐反黉N囊榜,通過篩選2013年和2014年的商品ID發(fā)現(xiàn),2014年新上架的產(chǎn)品共有171種亥宿,貢獻(xiàn)的銷售量為3287件卸勺,同時2014年總共銷售產(chǎn)品有578種,總銷售量為42241件烫扼,新品率為29.6%曙求,銷售量貢獻(xiàn)率僅為7.8%,可以看出2014年銷售量的提升主要還是源自老產(chǎn)品銷量的提升。
(3)用戶行為方面
在用戶行為方面悟狱,本文假設(shè)銷售量的提升是因?yàn)橛脩舢a(chǎn)品連帶率的提升以及用戶復(fù)購率的提升静浴,產(chǎn)品連帶率=用戶在一次消費(fèi)中購買了2種及以上的商品購買量/總購買量,這個數(shù)值越大挤渐,說明用戶單次消費(fèi)中連帶購買產(chǎn)品越多苹享。為了計(jì)算這個指標(biāo),在原數(shù)據(jù)中構(gòu)建輔助列浴麻,將用戶ID+訂單日期定義為一次購買行為得问,如果在一次購買中出現(xiàn)了兩種以上產(chǎn)品,就說明用戶連帶消費(fèi)行為软免。通過Excel數(shù)據(jù)透視表工具進(jìn)行篩選椭赋,發(fā)現(xiàn)在一次購買行為中的商品種類均為1,說明用戶并沒有進(jìn)行連帶消費(fèi)或杠,銷量提升并沒有受到產(chǎn)品連帶率的影響。
另一方面宣蔚,如果一個用戶出現(xiàn)了多次一樣的一次購買行為向抢,說明該用戶出現(xiàn)了復(fù)購行為,復(fù)購行為的增加也會提升銷售量胚委,通過數(shù)據(jù)透視表對復(fù)購行為進(jìn)行統(tǒng)計(jì)挟鸠,發(fā)現(xiàn)用戶的一次購買行為計(jì)數(shù)均為1,說明并沒有出現(xiàn)復(fù)購行為亩冬,復(fù)購沒有對銷售量的提升有所影響艘希。
4.4產(chǎn)品銷售數(shù)據(jù)分析總結(jié)
母嬰用品銷售數(shù)據(jù)逐年上升,說明母嬰用品市場發(fā)展趨勢良好硅急,同時母嬰用品銷售高峰集中在一年的第四季度覆享,尤其是11月份,商家應(yīng)該把握機(jī)會营袜,在年底的時候加大促銷力度撒顿,提升產(chǎn)品銷售量,在產(chǎn)品細(xì)分方面荚板,母嬰用品的6個主要類目產(chǎn)品中凤壁,銷量排名前三的分別是28、50014815跪另、50008168三類商品拧抖,這三類商品銷量占總銷量的88%,商家在備貨的時候應(yīng)該著重關(guān)注這三類產(chǎn)品免绿,同時這三類產(chǎn)品具有不同的特征唧席,其中28、50014815兩類商品屬于購買次數(shù)少,單次購買量大的商品袱吆,商家對于這兩類商品應(yīng)該提高單次交易銷售量厌衙,設(shè)置例如大禮包、促銷裝绞绒、量大優(yōu)惠等產(chǎn)品促銷活動婶希,提高單次成交額,而50008168這類商品屬于購買次數(shù)多蓬衡,單次購買量少的商品喻杈,對于這類商品商家應(yīng)該進(jìn)行長期促銷活動,提高消費(fèi)者購買次數(shù)狰晚,進(jìn)而提高銷售量筒饰。
在銷售量提升影響因素探析方面,本文從用戶壁晒、產(chǎn)品瓷们、用戶行為三個方面進(jìn)行了分析,通過相關(guān)數(shù)據(jù)驗(yàn)證秒咐,發(fā)現(xiàn)2013年-2014年母嬰用品銷售提升的主要影響因素分別是新用戶的大量增加谬晕,以及2013年的熱賣產(chǎn)品在2014年銷量繼續(xù)走高,針對這個情況携取,商家應(yīng)該積極推出一系列新用戶優(yōu)惠活動攒钳,吸引新顧客,同時關(guān)注之前的熱賣產(chǎn)品雷滋,做好相關(guān)產(chǎn)品的推廣活動不撑。
5用戶需求數(shù)據(jù)分析
通過假設(shè)檢驗(yàn)分析法,分析不同的用戶特征對產(chǎn)品需求的影響晤斩,為了方便分析焕檬,本文通過VLOOKUP函數(shù)構(gòu)建產(chǎn)品銷售數(shù)據(jù)-用戶信息匹配表。
5.1假設(shè)不同的嬰兒性別會對產(chǎn)品銷量造成影響
從圖中可以看出澳泵,男孩揩页、女孩人數(shù)人別為438人、492人烹俗,占比分別為47%和53%爆侣,男孩、女孩產(chǎn)品購買量分別為559件幢妄、935件兔仰,占比分別為37%和63%,在男孩蕉鸳、女孩人數(shù)相差不大的情況下乎赴,女孩的產(chǎn)品購買量大于男孩的購買量忍法,可以說明女孩對母嬰產(chǎn)品有更大的需求,為了能進(jìn)一步確定性別對產(chǎn)品需求量的影響榕吼,再用Excel數(shù)據(jù)分析工具中的方差分析進(jìn)行檢驗(yàn)饿序,檢驗(yàn)結(jié)果如圖所示:
其中P值遠(yuǎn)小于0.05(置信度),說明男孩羹蚣、女孩之間對母嬰用品的需求有顯著地差別原探。其中,銷售量差距最大的是50014815類產(chǎn)品顽素。
5.2假設(shè)不同年齡對產(chǎn)品需求量造成影響
各年齡段嬰兒中對母嬰用品需求量最大的是1歲以下的嬰兒咽弦,產(chǎn)品購買量為546件,其次是1-3歲的嬰兒胁出,產(chǎn)品購買量為488件型型,同時準(zhǔn)父母為尚未出生的寶寶備貨的熱情也是非常高漲的,嬰兒尚未出生的用戶人數(shù)為144人全蝶,產(chǎn)品需求量為237闹蒜。為了可以進(jìn)一步確定年齡段對產(chǎn)品需求量的影響,本文用方差分析進(jìn)行檢驗(yàn)抑淫,檢驗(yàn)結(jié)果如圖所示:
其中P值小于0.05嫂用,說明各年齡段對產(chǎn)品的需求量有顯著的產(chǎn)別,1歲以下的嬰兒對50014815類產(chǎn)品需求量最高丈冬,1-3歲的嬰兒對5008168類產(chǎn)品需求量最高,提前備貨的準(zhǔn)父母們則對各類產(chǎn)品需求相對平均甘畅。
5.3用戶需求數(shù)據(jù)分析總結(jié)
本文用假設(shè)檢驗(yàn)法分析了嬰兒性別及年齡對產(chǎn)品銷售量的影響埂蕊,并進(jìn)一步通過方差分析進(jìn)行了檢驗(yàn),結(jié)果發(fā)現(xiàn)嬰兒的性別及年齡對母嬰用品的銷售量有著顯著地影響疏唾,其中女孩比男孩有著更高的產(chǎn)品需求蓄氧,女孩對50014815類產(chǎn)品需求最高,而男孩對5008169類產(chǎn)品需求最高槐脏,商家應(yīng)該有針對性地對產(chǎn)品設(shè)置男女款喉童,分別進(jìn)行促銷,同時嬰兒不同的年齡對產(chǎn)品的需求也有顯著的差別顿天,其中母嬰用品需求最旺盛的分別是1歲以下及1-3歲堂氯,同時一些準(zhǔn)父母也對會提前備貨,因此商家應(yīng)該加大對低年齡段嬰兒的產(chǎn)品推廣牌废,同時邀請父母參加相關(guān)產(chǎn)品的體驗(yàn)測評活動咽白。