你好或辖,我是Ericsome瘾英。我正在參加一個數據分析課程,以下是我數據分析項目計劃制定的作業(yè)颂暇,分享給你缺谴,歡迎與我交流。
背景知識
百聯集團擁有購物中心蟀架,商超瓣赂,綜合百貨等核心業(yè)務榆骚,遍布全國25個省市7100余家營業(yè)網點片拍,涵蓋了國際商貿流通集團現有的各種業(yè)態(tài),如百貨妓肢,標準超市捌省,大賣場,便利店碉钠,購物中心纲缓,品牌折扣店等卷拘。在目前中國商品零售總額增速趨緩,而網絡零售占比不斷上升的今天祝高,百聯集團也面臨著巨大的競爭壓力栗弟。以線下為主的經營模式,在物業(yè)和人力成本不斷增長的今天工闺,對于單店營業(yè)額的要求越來越高乍赫。對線下客戶缺乏感知,缺乏良好的客戶體系陆蟆,使得高凈值客戶失聯雷厂。在這背后,是底層缺少對客戶的數字化沉淀叠殷,無法進行客戶價值挖掘改鲫,會員運營方式單一。消費者的理解停留在消費結果上林束,對商品選擇歷史像棘,消費動機等缺乏認知手段。
為了能夠線上線下融合诊县,提高單店績效讲弄,同時實現精準營銷個性化服務,提升顧客粘性依痊,百聯集團于2015年成立了全渠道電子商務公司避除,初步建立了會員一體,營銷一體的線上數據中臺體系胸嘁。加上對店內智能wifi瓶摆,智能貨架,以及各種智能攝像頭的應用性宏,對于人群井,貨,場等三個方面的數據有了全鏈路的關聯毫胜。
目前主要數據舉例:
目前百聯會員體系已經聯通了旗下所有零售業(yè)態(tài)书斜,百聯對于優(yōu)選會員會定期發(fā)放優(yōu)惠券和其他激勵措施,鼓勵在各商場進行消費酵使。
作業(yè):基于現有數據體系荐吉,請給出完整的數據分析項目計劃(包含重點數據收集到分析方法等),以論證對會員體系的投入是對百聯業(yè)務發(fā)展有積極作用的口渔。
分析思路:
1.要論證會員體系的投入是對百聯業(yè)務發(fā)展有積極作用样屠,需要基于對業(yè)務的理解確定重點關注數據,也就是企業(yè)認為對百聯業(yè)務發(fā)展有積極作用的指標;
2.通過這些指標在實施會員體系前后的變化來證明會員體系的投入促進了業(yè)務發(fā)展痪欲;
3.還需要考慮定期發(fā)放優(yōu)惠券和其他激勵措施的成本悦穿,從中得到投入與產出之間的回歸模型,用于之后發(fā)放優(yōu)惠券的參考业踢;
4.通過聚類分析發(fā)現定期發(fā)放優(yōu)惠券效果較好的門店特征栗柒,好門店的做法可以推廣到其他門店。
界定業(yè)務問題:
WHAT
1.實施會員體系前后知举,營業(yè)額傍衡、毛利潤和人均消費是多少;
2.實施會員體系后负蠕,會員為營業(yè)額和毛利潤貢獻百分比是多少蛙埂;
3.會員體系的投入與產出之間存在什么樣的數量關系。
HOW
通過對門店的分析遮糖,發(fā)現會員體系投入產出效果好的門店绣的,分析總結經驗推廣到其它門店。
1.定義會員體系投入產出效果好的門店欲账,從流量屡江、轉化、粘性和商品數據數據中識別具體特征赛不;
2.從數據中找門店針對性需要提高的方向惩嘉,并進行實施,跟蹤實施后的情況踢故。
數據收集:
分析單位為門店
1.收集不同門店不同時間的營業(yè)額文黎、毛利潤和人均消費;
2.收集不同門店不同時間會員用戶消費額以及產生的毛利潤殿较;
3.收集投入會員體系后耸峭,不同門店發(fā)放優(yōu)惠券總面值和使用的優(yōu)惠券總面值;
4.收集投入會員體系后淋纲,不同門店使用的優(yōu)惠券總面值和使用優(yōu)惠券的交易的毛利潤劳闹;
5.收集投入會員體系后,不同門店每天進店人數洽瞬、在店停留時長本涕、密度分布、商圈到進店轉化率伙窃、門店到不同區(qū)域停留轉化率菩颖、不同區(qū)域停留到支付轉化率、用戶留存率对供、到店間隔位他、品類區(qū)域集客到貨架停留轉化率、貨架停留到商品觸達轉化率产场、商品觸達到交易轉化率鹅髓。
評估整體數據狀況
1.評估各個數據源的完整和及時:客戶數量應當與實際接近數量差別較大時,則需要檢查數據庫京景;數據來源的時間要符合會員體系投入前后至少一年的數據窿冯,不然難以得出有效結論;
2.評估匯總數據的準確性和一致性:隨機檢查抽取的數據是否與數據庫中一致确徙,保證數據準確醒串。
數據清洗和整理
1.檢查是否有數據有明顯違背常識的錯誤和數據的離群值,發(fā)現后鄙皇,先檢查同一客戶原表是否是同樣的數值芜赌,再檢查此數據是如何收集而來,最后才是如何從技術角度評估是否是離群伴逸,通過相關統(tǒng)計指標和諸如設定上下限的方法來處理離群值缠沈;
2.對于特殊數字,先標注“缺失值”错蝴,有完善的數據字典查詢這個字段的實際情況洲愤,如果沒有就去和相關團隊溝通證實此類問題。
數據整理
1.對數據進行統(tǒng)一的格式化和命名規(guī)則處理顷锰;
2.對某些信息進行重新編碼以滿足后續(xù)分析需求柬赐。
數據可視化與探索
1.用直方圖展現會員體系前后,營業(yè)額官紫、毛利潤和人均消費是多少肛宋,橫軸表示時間,縱軸表示對應的金額束世;
2.用餅圖展現會員體系后悼吱,會員為營業(yè)額和毛利潤貢獻百分比是多少;
3.用散點圖展現同一門店不同時間發(fā)放優(yōu)惠券總面值和使用的優(yōu)惠券總面值良狈;
4.用散點圖展現同一門店不同時間使用的優(yōu)惠券總面值和使用優(yōu)惠券的交易的毛利潤后添;
5.熱力圖展現不同門店使用的優(yōu)惠券總面值和使用優(yōu)惠券的交易的毛利潤,橫軸為門店使用的優(yōu)惠券總面值薪丁,縱軸為使用優(yōu)惠券的交易的毛利潤遇西。
數據分析與模型
1.聚類分析:根據門店數據,會用聚類分析严嗜,將會員體系投入產出效果好的門店合成門店集粱檀,確定會員體系投入產出效果好的門店特征;
2.回歸模型:通過計算不同門店發(fā)放優(yōu)惠券總面值和使用優(yōu)惠券的交易毛利潤的回歸方程漫玄,確定使用的優(yōu)惠券總面值與使用優(yōu)惠券的交易毛利潤之間的線性關系茄蚯,以此為依據來反推優(yōu)惠券發(fā)放計劃的規(guī)模压彭。