——目錄————————————————————
一耻卡、數(shù)據(jù)描述
二吉执、提出問(wèn)題
三疯淫、數(shù)據(jù)探索
四、總結(jié)
—————————————————————————
一戳玫、數(shù)據(jù)描述
以上為優(yōu)衣庫(kù)銷售數(shù)據(jù)的數(shù)據(jù)字典熙掺,根據(jù)優(yōu)衣庫(kù)數(shù)據(jù)進(jìn)行業(yè)務(wù)的深入學(xué)習(xí)和理解
二、提出問(wèn)題
1.優(yōu)衣庫(kù)的受眾畫像
20-40歲青壯年咕宿,女性偏多币绩,線下為主,
2.整體銷售情況隨著時(shí)間的變化是怎樣的
3.不同產(chǎn)品的銷售情況是怎樣的府阀?顧客偏愛哪種購(gòu)買方式
4.銷售額和成本之間有什么關(guān)系缆镣?
三、數(shù)據(jù)探索
1.銷售渠道
data['channel'].value_counts()
結(jié)論:優(yōu)衣庫(kù)以線下銷售為主
#查看線上與線下每個(gè)訂單的平均收入
data['revenue'].groupby(data['channel']).mean()
—————————————————————————————————
#output:
channel
線上 167.910149
線下 157.760277
結(jié)論:線上線下每個(gè)訂單的平均收入基本上沒(méi)有差別
2.性別
結(jié)論:女性偏多
3.年齡
data['age_group'].value_counts()
_____________________________
#output:
30-34 4426
25-29 4224
35-39 3691
20-24 3345
40-44 1955
>=60 1574
45-49 1095
50-54 672
<20 660
55-59 514
Unkown 137
20-40歲消費(fèi)記錄最多
data['revenue'].groupby(data['age_group']).mean().sort_values()
______________________
#output:
age_group
Unkown 89.079270
<20 122.922318
40-44 124.004000
>=60 127.982948
55-59 137.365253
45-49 138.654219
50-54 146.992009
35-39 157.302281
20-24 165.049151
30-34 176.660045
25-29 185.470419
同樣试浙,20-40歲每單平均消費(fèi)金額最多
4.購(gòu)買發(fā)生的時(shí)間段
#分別求和‘工作日’和‘周末’的總營(yíng)業(yè)收入
data['revenue'].groupby(data['wkd_ind']).sum()
————————————————————
#output:
Weekday 2093947.98
Weekend 1462484.87
Name: revenue, dtype: float64
#分別計(jì)算"工作日"和"周末"的每日平均營(yíng)業(yè)收入
print('Weekday average revenue:'+str(2093947.98/5))#weekday為5天
print('Weekend average revenue:'+str(1462484.87/2))#weekend為2天
————————————————————
#output:
Weekday average revenue:418789.596
Weekend average revenue:731242.435
wkd_ind
Weekday 21319
Weekend 15007
結(jié)論:周末每日的平均銷售收入比工作日多
data['customer'].groupby(data['wkd_ind']).sum()
print('Weekday customers each day:'+str(21319/5))
print('Weekend customers: each day:'+str(15007/2))
_______________________
output:
wkd_ind
Weekday 21319
Weekend 15007
Weekday customers each day:4263.8
Weekend customers: each day:7503.5
結(jié)論:周末客人每日比工作日多3000人
5.每類產(chǎn)品的銷售情況
每類產(chǎn)品銷量 | 每類產(chǎn)品每件平均利潤(rùn) | 每類產(chǎn)品總利潤(rùn) |
---|---|---|
5.1每類產(chǎn)品銷量
#每類產(chǎn)品賣出去多少件
data['quant'].groupby(data['product']).sum().sort_values()
T恤董瞻、當(dāng)季新品最多,裙子、毛衣最少
5.2每類產(chǎn)品的利潤(rùn)情況
創(chuàng)建新的3個(gè)列:每筆記錄的利潤(rùn)钠糊、每件產(chǎn)品利潤(rùn)挟秤、每筆記錄是否虧損
#創(chuàng)建每筆記錄利潤(rùn):利潤(rùn)=收入-每件產(chǎn)品成本*產(chǎn)品數(shù)量
#profit=revenue-unit_cost*quant
def profit(revenue,unit_cost,quant):
return revenue-unit_cost*quant
data['profit']=data.apply(lambda x:profit(x['revenue'],x['unit_cost'],x['quant']),axis=1)
#創(chuàng)建每件產(chǎn)品利潤(rùn):每件產(chǎn)品利潤(rùn)=每筆記錄利潤(rùn)/每筆記錄產(chǎn)品數(shù)量
data['profit_per_product']=data.apply(lambda x:x['profit']/x['quant'],axis=1)
#創(chuàng)建訂單是否虧損:1為盈利,0為虧損
def profit_or_loss(profit):
if profit>0:
return 1
else:
return 0
data['profit_or_loss']=data.apply(lambda x:profit_or_loss(x['profit']),axis=1)
#可視化每類產(chǎn)品的訂單虧損比例
sns.barplot(x='product',y='profit_or_loss',data=data)
發(fā)現(xiàn):所有的記錄中當(dāng)季新品抄伍、運(yùn)動(dòng)和牛仔褲類型虧損比例最大艘刚,牛仔褲只有4成左右的記錄是盈利的,這三類大部分記錄在“虧本銷售”截珍。
接下來(lái)看下不同產(chǎn)品的總利潤(rùn):
data['profit'].groupby(data['product']).sum().sort_values()
發(fā)現(xiàn):T恤攀甚、配件、當(dāng)季新品利潤(rùn)最高岗喉,盡管當(dāng)季新品秋度、牛仔褲大比例訂單在虧損,但整體卻仍可以實(shí)現(xiàn)盈利沈堡,
四静陈、總結(jié)
1.優(yōu)衣庫(kù)的受眾畫像
20-40歲,女性偏多诞丽,T恤愛好者
2.整體銷售情況隨著時(shí)間的變化是怎樣的
周末人流更多鲸拥,銷售額更高
3.不同產(chǎn)品的銷售情況是怎樣的?顧客偏愛哪種購(gòu)買方式
優(yōu)衣庫(kù)的三大銷售冠軍:T恤僧免、當(dāng)季新品刑赶、配件
優(yōu)衣庫(kù)的三大盈利冠軍:T恤、當(dāng)季新品懂衩、配件
優(yōu)衣庫(kù)最具盈利潛力產(chǎn)品:毛衣撞叨,倒數(shù)第二的銷量,貢獻(xiàn)了第四的利潤(rùn)浊洞,單件利潤(rùn)極高
最需要調(diào)整生產(chǎn)營(yíng)銷策略的產(chǎn)品:牛仔褲牵敷,雖然整體盈利,但是6成交易都在虧損法希,可以考慮是不是產(chǎn)量預(yù)估枷餐、上市季節(jié)等策略失誤有關(guān)系
顧客偏愛線下交易
4.銷售額和成本之間有什么關(guān)系?
有一定關(guān)聯(lián)苫亦,但關(guān)聯(lián)度不是特別強(qiáng)