1侨把、案例背景
Thera Bank是一家擁有不斷增長(zhǎng)客戶群的銀行,該銀行中的大多數(shù)客戶的存款規(guī)模是不一樣的。由于貸款業(yè)務(wù)的客戶數(shù)量很少看疗,所以銀行希望有效地將存款用戶轉(zhuǎn)化為貸款用戶,以此擴(kuò)大貸款業(yè)務(wù)量基礎(chǔ)睦授,并在此過(guò)程中两芳,通過(guò)利息差賺取更多利潤(rùn)。
因此去枷,該銀行去年為存款用戶但從未辦理個(gè)人貸款的用戶開展了一項(xiàng)推廣活動(dòng)來(lái)促使其辦理個(gè)人貸款業(yè)務(wù)怖辆。已有部分客戶通過(guò)該活動(dòng)新辦理了個(gè)人貸款業(yè)務(wù)是复,零售營(yíng)銷部門希望能制定更好的策略來(lái)定位營(yíng)銷,以最小預(yù)算提升成功率竖螃。更準(zhǔn)確地說(shuō)淑廊,該部門希望能夠識(shí)別更有可能進(jìn)行貸款的潛在用戶,提高轉(zhuǎn)化成功率特咆,降低營(yíng)銷費(fèi)用季惩。
# 導(dǎo)入相關(guān)模塊
import pandas as pd
import numpy as np
import matplotlib.pypolt as plt
import seaborn as sns
# 連接mysql
import pymysql
pymysql.install_as_MySQLdb()
# create_engine用于初始化數(shù)據(jù)庫(kù)連接
from sqlalchemy import create_engine
engine=create_engine('mysql://用戶名:密碼@localhost:3306/數(shù)據(jù)庫(kù)?charset=gbk')
# 讀取數(shù)據(jù)
Bank_Personal_Loan=pd.read_sql_query('select * from Personal_Loan', con=engine)
2、理解數(shù)據(jù)
數(shù)據(jù)集共包含14個(gè)字段腻格,各字段含義如下所示:
- ID:編號(hào)
- Age:年齡
- Experience:工作經(jīng)驗(yàn)
- Income:客戶年收入(單位:千美元)
- ZipCode:家庭地址郵編
- Family:客戶家庭規(guī)模
- CCAvg:每月信用卡消費(fèi)額(單位:千美元)
- Education:教育水平(1:本科画拾;2:研究生;3:高級(jí))
- Mortgage:房屋抵押價(jià)值(如有)(單位:千美元)
- Personal Loan:此客戶是否接受上一次活動(dòng)中提供的個(gè)人貸款(1:是菜职;0:否)
- Securities Account:是否有證券賬戶(1:是青抛;0:否)
- CD Account:是否有存款證明(1:是;0:否)
- Online:是否開通網(wǎng)上銀行(1:是酬核;0:否)
- Credit Card:是否擁有信用卡(1:是脂凶;0:否)
Bank_Personal_Loan.head()
Bank_Personal_Loan.info()
數(shù)據(jù)集包含5000條記錄,并無(wú)缺失愁茁、重復(fù)情況蚕钦;對(duì)于某些數(shù)值型字段需要做數(shù)據(jù)類型的轉(zhuǎn)換
# 更改變量類型
Bank_Personal_Loan['Age']=Bank_Personal_Loan['Age'].astype('int')
Bank_Personal_Loan['Experience']=Bank_Personal_Loan['Experience'].astype('int')
Bank_Personal_Loan['Income']=Bank_Personal_Loan['Income'].astype('float')
Bank_Personal_Loan['ZIP Code']=Bank_Personal_Loan['ZIP Code'].astype('int')
Bank_Personal_Loan['Family']=Bank_Personal_Loan['Family'].astype('int')
Bank_Personal_Loan['CCAvg']=Bank_Personal_Loan['CCAvg'].astype('float')
Bank_Personal_Loan['Education']=Bank_Personal_Loan['Education'].astype('int')
Bank_Personal_Loan['Mortgage']=Bank_Personal_Loan['Mortgage'].astype('float')
Bank_Personal_Loan['Personal Loan']=Bank_Personal_Loan['Personal Loan'].astype('int')
Bank_Personal_Loan['Securities Account']=Bank_Personal_Loan['Securities Account'].astype('int')
Bank_Personal_Loan['CD Account']=Bank_Personal_Loan['CD Account'].astype('int')
Bank_Personal_Loan['Online']=Bank_Personal_Loan['Online'].astype('int')
Bank_Personal_Loan['CreditCard']=Bank_Personal_Loan['CreditCard'].astype('int')
Bank_Personal_Loan.describe()
發(fā)現(xiàn)experience最小值為負(fù)值,有異常數(shù)據(jù)
# 將experience異常值修改為0
Bank_Personal_Loan.loc[Bank_Personal_Loan['Experience'] < 0, 'Experience']=0
Bank_Personal_Loan['Experience'].describe()
3鹅很、數(shù)據(jù)分析
整體思路:
一嘶居、去年銀行舉辦的推廣活動(dòng)效果如何
二、哪種類型的存款用戶轉(zhuǎn)化為貸款業(yè)務(wù)的潛在客戶可能性更大
三促煮、隨著客戶年收入增長(zhǎng)邮屁,貸款情況如何變化
四、隨著客戶年齡增長(zhǎng)菠齿,貸款情況如何變化
# 活動(dòng)推廣結(jié)果分析
Bank_Personal_Loan.groupby(['Personal Loan']).size()
可以發(fā)現(xiàn)在這次推廣活動(dòng)之后佑吝,5000名客戶中有480名客戶辦理了個(gè)人貸款業(yè)務(wù)。由于該活動(dòng)是針對(duì)未辦理個(gè)人貸款業(yè)務(wù)的客戶開展的绳匀,對(duì)比以往數(shù)據(jù)芋忿,個(gè)人貸款業(yè)務(wù)增長(zhǎng)近10%,說(shuō)明此次推廣活動(dòng)的效果還是不錯(cuò)的
# 探索其他變量與Personal Loan變量的關(guān)系
print(Bank_Personal_Loan.corr()['Personal Loan'])
# fig代表繪圖窗口(Figure)疾棵;axis代表這個(gè)繪圖窗口上的坐標(biāo)系(axis)
fig,axis=plt.subplots(figsize=(12,12))
# 繪制熱力圖戈钢,顏色越深,相關(guān)性越強(qiáng)
ax=sns.heatmap(Bank_Personal_Loan.corr(),annot=True,cmap='YlGnBu')
# bottom代表y軸下限是尔,top表示y軸上限(有些matplotlib版本畫熱力圖上下邊框只顯示一半)
bottom,top=ax.get_ylim()
ax.set_ylim(bottom+0.5, top-0.5)
從圖中可以看出:
1殉了、與開通信貸業(yè)務(wù)強(qiáng)相關(guān)的變量有:年收入、信用卡消費(fèi)額以及是否有該銀行存單賬戶拟枚;
2薪铜、與開通信貸業(yè)務(wù)弱相關(guān)的變量有:受教育程度众弓、房屋抵押價(jià)值以及家庭人數(shù);
3隔箍、家庭住址郵編田轧、是否擁有證券賬戶、是否開通網(wǎng)上銀行以及信用卡持有情況鞍恢,這些因素并不會(huì)產(chǎn)生多少影響傻粘;
4、年齡帮掉、工作經(jīng)驗(yàn)雖然關(guān)系不大弦悉,但是它們屬于連續(xù)的數(shù)值變量,需要分析后再做觀察蟆炊,注意是否有某一段存在特殊值稽莉;
1、定性變量與開通貸款業(yè)務(wù)的關(guān)系
(對(duì)定性變量中是否有該銀行存款賬戶涩搓、受教育程度污秆、家庭人數(shù)與是否開通貸款業(yè)務(wù)的關(guān)系進(jìn)行探究)
1.1 是否有該銀行存款賬戶
print(Bank_Personal_Loan.groupby('CD Account')['Personal Loan'].agg([np.mean]))
sns.countplot(x="CD Account", data=Bank_Personal_Loan, hue="Personal Loan") # 計(jì)數(shù)圖
可以發(fā)現(xiàn),擁有該銀行存款賬戶的客戶昧甘,其申請(qǐng)貸款業(yè)務(wù)的可能性是沒有開通的6倍多良拼,說(shuō)明開立了存款賬戶的客戶將會(huì)是主要的目標(biāo)客戶,同時(shí)找到方法讓客戶開立銀行存款賬戶也是一個(gè)提高貸款業(yè)務(wù)申請(qǐng)率的選項(xiàng)
1.2 教育水平
print(Bank_Personal_Loan.groupby('Education')['Personal Loan'].agg([np.mean, 'count']))
sns.catplot("Education", data=Bank_Personal_Loan, hue="Personal Loan",kind="count") # 分類估計(jì)圖充边,通過(guò)控制kind變量參數(shù)來(lái)設(shè)置不同的繪圖類型
學(xué)歷越高庸推,辦理貸款業(yè)務(wù)的人數(shù)越多,說(shuō)明更高教育水平的客戶更能夠接受超前消費(fèi)的觀念浇冰,其貸款的意愿也會(huì)更高贬媒。因此,高學(xué)歷層次的客戶群體更有可能成為銀行貸款業(yè)務(wù)的潛在客戶
1.3 家庭人數(shù)
print(Bank_Personal_Loan.groupby('Family')['Personal Loan'].agg([np.mean]))
sns.catplot("Family", data=Bank_Personal_Loan, hue="Personal Loan",kind="count")
單身人士與沒有孩子的家庭的貸款率都比較低肘习,有孩子的家庭用戶相對(duì)而言更有意愿轉(zhuǎn)化為貸款用戶际乘,特別是獨(dú)生子女家庭
2、定量變量與開通貸款業(yè)務(wù)的關(guān)系
(對(duì)定量變量中年齡漂佩、收入脖含、信用卡還款額以及房屋抵押貸款與是否開通貸款業(yè)務(wù)的關(guān)系進(jìn)行探究)
2.1 年齡
print(Bank_Personal_Loan.groupby('Personal Loan')['Age'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Age", data=Bank_Personal_Loan)
# 對(duì)年齡分層
Bank_Personal_Loan['Age Bins'] = pd.qcut(Bank_Personal_Loan.Age, 6)
print(Bank_Personal_Loan.groupby('Age Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('Age Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()
綜合來(lái)看,各年齡階段的客戶貸款意愿都差別不大仅仆,相對(duì)來(lái)說(shuō)在32~39歲之間的客戶貸款意愿較強(qiáng)
2.2 收入
print(Bank_Personal_Loan.groupby('Personal Loan')['Income'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Income", data=Bank_Personal_Loan)
從平均水平來(lái)看器赞,高收入人群的貸款意愿會(huì)比低收入的更高
# 對(duì)收入分層
Bank_Personal_Loan['Income Bins'] = pd.qcut(Bank_Personal_Loan.Income, 20)
print(Bank_Personal_Loan.groupby('Income Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('Income Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()
收入的單位是千美元垢袱∧拱荩可以發(fā)現(xiàn),當(dāng)年收入超過(guò)8.2萬(wàn)元時(shí)请契,貸款意愿會(huì)有5倍以上的上升咳榜;超過(guò)9.8萬(wàn)元夏醉,貸款意愿達(dá)到17%以上;超過(guò)17萬(wàn)元時(shí)涌韩,貸款意愿達(dá)到一半畔柔。這反映了高收入人群具有更高貸款意愿的趨勢(shì),同時(shí)年收入在8.2萬(wàn)美元以上的客戶群體是主要的貸款活動(dòng)推廣對(duì)象臣樱。
2.3 房屋抵押價(jià)值
print(Bank_Personal_Loan.groupby('Personal Loan')['Mortgage'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Mortgage", data=Bank_Personal_Loan)
# 對(duì)房屋抵押價(jià)值進(jìn)行分層
Bank_Personal_Loan['Mortgage Bins'] = pd.cut(Bank_Personal_Loan.Mortgage, 10)
print(Bank_Personal_Loan.groupby('Mortgage Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('Mortgage Bins')['Personal Loan'].agg({'Loan print(Bank_Personal_Loan.groupby('Personal Loan')['Mortgage'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Mortgage", data=Bank_Personal_Loan) Rate':np.mean}).plot(figsize=(14,7))
房屋抵押價(jià)值的單位是千美元靶擦。當(dāng)?shù)盅簝r(jià)值大于19.05萬(wàn)美元時(shí),貸款申請(qǐng)意愿有顯著提升雇毫⌒叮總體來(lái)看,房屋抵押價(jià)值越高棚放,客戶的貸款申請(qǐng)意愿會(huì)更強(qiáng)烈
2.4 每月信用卡消費(fèi)額
print(Bank_Personal_Loan.groupby('Personal Loan')['CCAvg'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="CCAvg", data=Bank_Personal_Loan)
大部分沒有申請(qǐng)貸款的客戶枚粘,信用卡消費(fèi)額的均值在1.7K美元左右,而申請(qǐng)貸款的客戶信用款消費(fèi)額均值達(dá)到了3.9K美元飘蚯,是前者的2倍有多
# 對(duì)信用卡消費(fèi)額進(jìn)行分層
Bank_Personal_Loan['CCAvg Bins'] = pd.qcut(Bank_Personal_Loan.CCAvg, 20)
print(Bank_Personal_Loan.groupby('CCAvg Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('CCAvg Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()
大概在每月消費(fèi)額為2.8千美元時(shí)馍迄,申請(qǐng)貸款率會(huì)增大4倍;超過(guò)6千美元時(shí)局骤,申請(qǐng)貸款率會(huì)回落到31%左右攀圈,但整體來(lái)看,高消費(fèi)客戶群體的貸款意愿相對(duì)還是很強(qiáng)烈的
因此峦甩,每月消費(fèi)額在2.8千美元以上的客戶是重點(diǎn)營(yíng)銷客戶
4量承、結(jié)論
1、這次推廣活動(dòng)讓個(gè)人貸款業(yè)務(wù)增長(zhǎng)近10%穴店,說(shuō)明此次推廣活動(dòng)的效果還是不錯(cuò)的
2撕捍、對(duì)于開通了銀行存款賬戶的用戶需要加強(qiáng)營(yíng)銷力度,他們的貸款意愿相對(duì)于沒有開通銀行存款賬戶的客戶群體要更加強(qiáng)烈
3泣洞、高學(xué)歷層次的客戶群體更有可能成為銀行貸款業(yè)務(wù)的潛在客戶
4忧风、家庭人口較多的家庭貸款意愿較強(qiáng),尤其是獨(dú)生子女家庭
5球凰、年齡區(qū)間在30-40歲的客戶相對(duì)貸款意愿更強(qiáng)
6狮腿、高收入人群具有更高的貸款意愿,同時(shí)年收入在8.2萬(wàn)美元以上的客戶群體是主要的貸款活動(dòng)推廣對(duì)象
7呕诉、當(dāng)房屋抵押值大于19.05萬(wàn)美元時(shí)缘厢,客戶申請(qǐng)貸款的意愿有明顯的提升
8、每月信用卡消費(fèi)額在2.8千美元以上的客戶甩挫,其貸款申請(qǐng)的意愿會(huì)有顯著的提升