銀行貸款拉新活動(dòng)分析

1侨把、案例背景

Thera Bank是一家擁有不斷增長(zhǎng)客戶群的銀行,該銀行中的大多數(shù)客戶的存款規(guī)模是不一樣的。由于貸款業(yè)務(wù)的客戶數(shù)量很少看疗,所以銀行希望有效地將存款用戶轉(zhuǎn)化為貸款用戶,以此擴(kuò)大貸款業(yè)務(wù)量基礎(chǔ)睦授,并在此過(guò)程中两芳,通過(guò)利息差賺取更多利潤(rùn)。

因此去枷,該銀行去年為存款用戶但從未辦理個(gè)人貸款的用戶開展了一項(xiàng)推廣活動(dòng)來(lái)促使其辦理個(gè)人貸款業(yè)務(wù)怖辆。已有部分客戶通過(guò)該活動(dòng)新辦理了個(gè)人貸款業(yè)務(wù)是复,零售營(yíng)銷部門希望能制定更好的策略來(lái)定位營(yíng)銷,以最小預(yù)算提升成功率竖螃。更準(zhǔn)確地說(shuō)淑廊,該部門希望能夠識(shí)別更有可能進(jìn)行貸款的潛在用戶,提高轉(zhuǎn)化成功率特咆,降低營(yíng)銷費(fèi)用季惩。

# 導(dǎo)入相關(guān)模塊
import pandas as pd
import numpy as np
import matplotlib.pypolt as plt
import seaborn as sns
# 連接mysql
import pymysql
pymysql.install_as_MySQLdb()
# create_engine用于初始化數(shù)據(jù)庫(kù)連接
from sqlalchemy import create_engine
engine=create_engine('mysql://用戶名:密碼@localhost:3306/數(shù)據(jù)庫(kù)?charset=gbk')

# 讀取數(shù)據(jù)
Bank_Personal_Loan=pd.read_sql_query('select * from Personal_Loan', con=engine)

2、理解數(shù)據(jù)

數(shù)據(jù)集共包含14個(gè)字段腻格,各字段含義如下所示:

  • ID:編號(hào)
  • Age:年齡
  • Experience:工作經(jīng)驗(yàn)
  • Income:客戶年收入(單位:千美元)
  • ZipCode:家庭地址郵編
  • Family:客戶家庭規(guī)模
  • CCAvg:每月信用卡消費(fèi)額(單位:千美元)
  • Education:教育水平(1:本科画拾;2:研究生;3:高級(jí))
  • Mortgage:房屋抵押價(jià)值(如有)(單位:千美元)
  • Personal Loan:此客戶是否接受上一次活動(dòng)中提供的個(gè)人貸款(1:是菜职;0:否)
  • Securities Account:是否有證券賬戶(1:是青抛;0:否)
  • CD Account:是否有存款證明(1:是;0:否)
  • Online:是否開通網(wǎng)上銀行(1:是酬核;0:否)
  • Credit Card:是否擁有信用卡(1:是脂凶;0:否)
Bank_Personal_Loan.head()
Bank_Personal_Loan.info()

數(shù)據(jù)集包含5000條記錄,并無(wú)缺失愁茁、重復(fù)情況蚕钦;對(duì)于某些數(shù)值型字段需要做數(shù)據(jù)類型的轉(zhuǎn)換

# 更改變量類型
Bank_Personal_Loan['Age']=Bank_Personal_Loan['Age'].astype('int')
Bank_Personal_Loan['Experience']=Bank_Personal_Loan['Experience'].astype('int')
Bank_Personal_Loan['Income']=Bank_Personal_Loan['Income'].astype('float')
Bank_Personal_Loan['ZIP Code']=Bank_Personal_Loan['ZIP Code'].astype('int')
Bank_Personal_Loan['Family']=Bank_Personal_Loan['Family'].astype('int')
Bank_Personal_Loan['CCAvg']=Bank_Personal_Loan['CCAvg'].astype('float')
Bank_Personal_Loan['Education']=Bank_Personal_Loan['Education'].astype('int')
Bank_Personal_Loan['Mortgage']=Bank_Personal_Loan['Mortgage'].astype('float')
Bank_Personal_Loan['Personal Loan']=Bank_Personal_Loan['Personal Loan'].astype('int')
Bank_Personal_Loan['Securities Account']=Bank_Personal_Loan['Securities Account'].astype('int')
Bank_Personal_Loan['CD Account']=Bank_Personal_Loan['CD Account'].astype('int')
Bank_Personal_Loan['Online']=Bank_Personal_Loan['Online'].astype('int')
Bank_Personal_Loan['CreditCard']=Bank_Personal_Loan['CreditCard'].astype('int')
Bank_Personal_Loan.describe()

發(fā)現(xiàn)experience最小值為負(fù)值,有異常數(shù)據(jù)

# 將experience異常值修改為0
Bank_Personal_Loan.loc[Bank_Personal_Loan['Experience'] < 0, 'Experience']=0
Bank_Personal_Loan['Experience'].describe()

3鹅很、數(shù)據(jù)分析

整體思路:
一嘶居、去年銀行舉辦的推廣活動(dòng)效果如何
二、哪種類型的存款用戶轉(zhuǎn)化為貸款業(yè)務(wù)的潛在客戶可能性更大
三促煮、隨著客戶年收入增長(zhǎng)邮屁,貸款情況如何變化
四、隨著客戶年齡增長(zhǎng)菠齿,貸款情況如何變化

# 活動(dòng)推廣結(jié)果分析
Bank_Personal_Loan.groupby(['Personal Loan']).size()

可以發(fā)現(xiàn)在這次推廣活動(dòng)之后佑吝,5000名客戶中有480名客戶辦理了個(gè)人貸款業(yè)務(wù)。由于該活動(dòng)是針對(duì)未辦理個(gè)人貸款業(yè)務(wù)的客戶開展的绳匀,對(duì)比以往數(shù)據(jù)芋忿,個(gè)人貸款業(yè)務(wù)增長(zhǎng)近10%,說(shuō)明此次推廣活動(dòng)的效果還是不錯(cuò)的

# 探索其他變量與Personal Loan變量的關(guān)系
print(Bank_Personal_Loan.corr()['Personal Loan'])
# fig代表繪圖窗口(Figure)疾棵;axis代表這個(gè)繪圖窗口上的坐標(biāo)系(axis)
fig,axis=plt.subplots(figsize=(12,12))
# 繪制熱力圖戈钢,顏色越深,相關(guān)性越強(qiáng)
ax=sns.heatmap(Bank_Personal_Loan.corr(),annot=True,cmap='YlGnBu')
# bottom代表y軸下限是尔,top表示y軸上限(有些matplotlib版本畫熱力圖上下邊框只顯示一半)
bottom,top=ax.get_ylim()
ax.set_ylim(bottom+0.5, top-0.5)

從圖中可以看出:
1殉了、與開通信貸業(yè)務(wù)強(qiáng)相關(guān)的變量有:年收入、信用卡消費(fèi)額以及是否有該銀行存單賬戶拟枚;
2薪铜、與開通信貸業(yè)務(wù)弱相關(guān)的變量有:受教育程度众弓、房屋抵押價(jià)值以及家庭人數(shù);
3隔箍、家庭住址郵編田轧、是否擁有證券賬戶、是否開通網(wǎng)上銀行以及信用卡持有情況鞍恢,這些因素并不會(huì)產(chǎn)生多少影響傻粘;
4、年齡帮掉、工作經(jīng)驗(yàn)雖然關(guān)系不大弦悉,但是它們屬于連續(xù)的數(shù)值變量,需要分析后再做觀察蟆炊,注意是否有某一段存在特殊值稽莉;

1、定性變量與開通貸款業(yè)務(wù)的關(guān)系

(對(duì)定性變量中是否有該銀行存款賬戶涩搓、受教育程度污秆、家庭人數(shù)與是否開通貸款業(yè)務(wù)的關(guān)系進(jìn)行探究)

1.1 是否有該銀行存款賬戶

print(Bank_Personal_Loan.groupby('CD Account')['Personal Loan'].agg([np.mean]))
sns.countplot(x="CD Account", data=Bank_Personal_Loan, hue="Personal Loan") # 計(jì)數(shù)圖

可以發(fā)現(xiàn),擁有該銀行存款賬戶的客戶昧甘,其申請(qǐng)貸款業(yè)務(wù)的可能性是沒有開通的6倍多良拼,說(shuō)明開立了存款賬戶的客戶將會(huì)是主要的目標(biāo)客戶,同時(shí)找到方法讓客戶開立銀行存款賬戶也是一個(gè)提高貸款業(yè)務(wù)申請(qǐng)率的選項(xiàng)

1.2 教育水平

print(Bank_Personal_Loan.groupby('Education')['Personal Loan'].agg([np.mean, 'count']))
sns.catplot("Education", data=Bank_Personal_Loan, hue="Personal Loan",kind="count") # 分類估計(jì)圖充边,通過(guò)控制kind變量參數(shù)來(lái)設(shè)置不同的繪圖類型

學(xué)歷越高庸推,辦理貸款業(yè)務(wù)的人數(shù)越多,說(shuō)明更高教育水平的客戶更能夠接受超前消費(fèi)的觀念浇冰,其貸款的意愿也會(huì)更高贬媒。因此,高學(xué)歷層次的客戶群體更有可能成為銀行貸款業(yè)務(wù)的潛在客戶

1.3 家庭人數(shù)

print(Bank_Personal_Loan.groupby('Family')['Personal Loan'].agg([np.mean]))
sns.catplot("Family", data=Bank_Personal_Loan, hue="Personal Loan",kind="count")

單身人士與沒有孩子的家庭的貸款率都比較低肘习,有孩子的家庭用戶相對(duì)而言更有意愿轉(zhuǎn)化為貸款用戶际乘,特別是獨(dú)生子女家庭

2、定量變量與開通貸款業(yè)務(wù)的關(guān)系

(對(duì)定量變量中年齡漂佩、收入脖含、信用卡還款額以及房屋抵押貸款與是否開通貸款業(yè)務(wù)的關(guān)系進(jìn)行探究)

2.1 年齡

print(Bank_Personal_Loan.groupby('Personal Loan')['Age'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Age", data=Bank_Personal_Loan) 
# 對(duì)年齡分層
Bank_Personal_Loan['Age Bins'] = pd.qcut(Bank_Personal_Loan.Age, 6)
print(Bank_Personal_Loan.groupby('Age Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('Age Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()


綜合來(lái)看,各年齡階段的客戶貸款意愿都差別不大仅仆,相對(duì)來(lái)說(shuō)在32~39歲之間的客戶貸款意愿較強(qiáng)

2.2 收入

print(Bank_Personal_Loan.groupby('Personal Loan')['Income'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Income", data=Bank_Personal_Loan) 

從平均水平來(lái)看器赞,高收入人群的貸款意愿會(huì)比低收入的更高

# 對(duì)收入分層
Bank_Personal_Loan['Income Bins'] = pd.qcut(Bank_Personal_Loan.Income, 20)
print(Bank_Personal_Loan.groupby('Income Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('Income Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()


收入的單位是千美元垢袱∧拱荩可以發(fā)現(xiàn),當(dāng)年收入超過(guò)8.2萬(wàn)元時(shí)请契,貸款意愿會(huì)有5倍以上的上升咳榜;超過(guò)9.8萬(wàn)元夏醉,貸款意愿達(dá)到17%以上;超過(guò)17萬(wàn)元時(shí)涌韩,貸款意愿達(dá)到一半畔柔。這反映了高收入人群具有更高貸款意愿的趨勢(shì),同時(shí)年收入在8.2萬(wàn)美元以上的客戶群體是主要的貸款活動(dòng)推廣對(duì)象臣樱。

2.3 房屋抵押價(jià)值

print(Bank_Personal_Loan.groupby('Personal Loan')['Mortgage'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Mortgage", data=Bank_Personal_Loan) 
# 對(duì)房屋抵押價(jià)值進(jìn)行分層
Bank_Personal_Loan['Mortgage Bins'] = pd.cut(Bank_Personal_Loan.Mortgage, 10)
print(Bank_Personal_Loan.groupby('Mortgage Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('Mortgage Bins')['Personal Loan'].agg({'Loan print(Bank_Personal_Loan.groupby('Personal Loan')['Mortgage'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="Mortgage", data=Bank_Personal_Loan) Rate':np.mean}).plot(figsize=(14,7))


房屋抵押價(jià)值的單位是千美元靶擦。當(dāng)?shù)盅簝r(jià)值大于19.05萬(wàn)美元時(shí),貸款申請(qǐng)意愿有顯著提升雇毫⌒叮總體來(lái)看,房屋抵押價(jià)值越高棚放,客戶的貸款申請(qǐng)意愿會(huì)更強(qiáng)烈

2.4 每月信用卡消費(fèi)額

print(Bank_Personal_Loan.groupby('Personal Loan')['CCAvg'].agg([np.mean, 'count']))
sns.boxenplot(x="Personal Loan", y="CCAvg", data=Bank_Personal_Loan) 

大部分沒有申請(qǐng)貸款的客戶枚粘,信用卡消費(fèi)額的均值在1.7K美元左右,而申請(qǐng)貸款的客戶信用款消費(fèi)額均值達(dá)到了3.9K美元飘蚯,是前者的2倍有多

# 對(duì)信用卡消費(fèi)額進(jìn)行分層
Bank_Personal_Loan['CCAvg Bins'] = pd.qcut(Bank_Personal_Loan.CCAvg, 20)
print(Bank_Personal_Loan.groupby('CCAvg Bins')['Personal Loan'].agg([np.mean, 'count']))
Bank_Personal_Loan.groupby('CCAvg Bins')['Personal Loan'].agg({'Loan Rate':np.mean}).plot()


大概在每月消費(fèi)額為2.8千美元時(shí)馍迄,申請(qǐng)貸款率會(huì)增大4倍;超過(guò)6千美元時(shí)局骤,申請(qǐng)貸款率會(huì)回落到31%左右攀圈,但整體來(lái)看,高消費(fèi)客戶群體的貸款意愿相對(duì)還是很強(qiáng)烈的
因此峦甩,每月消費(fèi)額在2.8千美元以上的客戶是重點(diǎn)營(yíng)銷客戶

4量承、結(jié)論

1、這次推廣活動(dòng)讓個(gè)人貸款業(yè)務(wù)增長(zhǎng)近10%穴店,說(shuō)明此次推廣活動(dòng)的效果還是不錯(cuò)的
2撕捍、對(duì)于開通了銀行存款賬戶的用戶需要加強(qiáng)營(yíng)銷力度,他們的貸款意愿相對(duì)于沒有開通銀行存款賬戶的客戶群體要更加強(qiáng)烈
3泣洞、高學(xué)歷層次的客戶群體更有可能成為銀行貸款業(yè)務(wù)的潛在客戶
4忧风、家庭人口較多的家庭貸款意愿較強(qiáng),尤其是獨(dú)生子女家庭
5球凰、年齡區(qū)間在30-40歲的客戶相對(duì)貸款意愿更強(qiáng)
6狮腿、高收入人群具有更高的貸款意愿,同時(shí)年收入在8.2萬(wàn)美元以上的客戶群體是主要的貸款活動(dòng)推廣對(duì)象
7呕诉、當(dāng)房屋抵押值大于19.05萬(wàn)美元時(shí)缘厢,客戶申請(qǐng)貸款的意愿有明顯的提升
8、每月信用卡消費(fèi)額在2.8千美元以上的客戶甩挫,其貸款申請(qǐng)的意愿會(huì)有顯著的提升

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末贴硫,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌英遭,老刑警劉巖间护,帶你破解...
    沈念sama閱讀 211,743評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異挖诸,居然都是意外死亡汁尺,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門多律,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)痴突,“玉大人,你說(shuō)我怎么就攤上這事狼荞“玻” “怎么了?”我有些...
    開封第一講書人閱讀 157,285評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵粘秆,是天一觀的道長(zhǎng)如迟。 經(jīng)常有香客問我,道長(zhǎng)攻走,這世上最難降的妖魔是什么殷勘? 我笑而不...
    開封第一講書人閱讀 56,485評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮昔搂,結(jié)果婚禮上玲销,老公的妹妹穿的比我還像新娘。我一直安慰自己摘符,他們只是感情好贤斜,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,581評(píng)論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著逛裤,像睡著了一般瘩绒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上带族,一...
    開封第一講書人閱讀 49,821評(píng)論 1 290
  • 那天锁荔,我揣著相機(jī)與錄音,去河邊找鬼蝙砌。 笑死阳堕,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的择克。 我是一名探鬼主播恬总,決...
    沈念sama閱讀 38,960評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼肚邢!你這毒婦竟也來(lái)了壹堰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,719評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎缀旁,沒想到半個(gè)月后记劈,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體勺鸦,經(jīng)...
    沈念sama閱讀 44,186評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡并巍,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,516評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了换途。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片懊渡。...
    茶點(diǎn)故事閱讀 38,650評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖军拟,靈堂內(nèi)的尸體忽然破棺而出剃执,到底是詐尸還是另有隱情,我是刑警寧澤懈息,帶...
    沈念sama閱讀 34,329評(píng)論 4 330
  • 正文 年R本政府宣布肾档,位于F島的核電站,受9級(jí)特大地震影響辫继,放射性物質(zhì)發(fā)生泄漏怒见。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,936評(píng)論 3 313
  • 文/蒙蒙 一姑宽、第九天 我趴在偏房一處隱蔽的房頂上張望遣耍。 院中可真熱鬧,春花似錦炮车、人聲如沸舵变。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,757評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)纪隙。三九已至,卻和暖如春扛或,著一層夾襖步出監(jiān)牢的瞬間瘫拣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,991評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工告喊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留麸拄,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,370評(píng)論 2 360
  • 正文 我出身青樓黔姜,卻偏偏與公主長(zhǎng)得像拢切,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子秆吵,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,527評(píng)論 2 349