一夜牡、案例背景
Thera Bank是一家擁有不斷增長客戶群的銀行导饲。這銀行中大多數(shù)客戶的存款規(guī)模都是不一樣的。由于貸款業(yè)務(wù)的客戶數(shù)量很少氯材,所以銀行希望有效地將存款用戶轉(zhuǎn)化為貸款用戶以此擴(kuò)大貸款業(yè)務(wù)量的基礎(chǔ)渣锦,以帶來更多的貸款業(yè)務(wù),并在此過程中氢哮,通過貸款利息賺取更多袋毙。
因此,該銀行去年為存款用戶但未辦理個人貸款業(yè)務(wù)的客戶開展了一項推廣活動來促使其辦理個人貸款業(yè)務(wù)冗尤,有部分客戶通過此活動已經(jīng)辦理了相關(guān)服務(wù)听盖。這時的零售營銷部門希望制定更好的策略去定位營銷,以最小的預(yù)算提高成功率裂七。該部門希望識別出更有可能購買貸款的潛在客戶皆看,提高轉(zhuǎn)化的成功率,降低營銷的費用背零。
二腰吟、數(shù)據(jù)理解
本數(shù)據(jù)集總計5000行,14列數(shù)據(jù),對應(yīng)字段理解如下:
- ID - 客戶唯一身份標(biāo)識
- Age - 客戶年齡屬性
- Experience - 客戶工作經(jīng)驗
- Income - 客戶年收入(單位:千美元)
- ZIP code - 家庭郵編
- Family - 客戶家庭成員人數(shù)
- CCAvg - 每月信用卡消費額(單位:千美元)
- Education - 客戶受教育程度(1:本科 2:研究生 3:高級)
- Mortgage - 房屋抵押價值(如有)(單位:千美元)
- Personal Loan - 此客戶是否接受上一次活動中提供的個人貸款毛雇?(1:是 0:否)
- Securities Account - 是否有證券賬戶嫉称?(1:是 0:否)
- CD Account - 是否有存款證明(CD)帳戶嗎(1:是 0:否)
- Online - 是否有網(wǎng)銀賬號(1:是 0:否)
- CreditCard - 是否有信用卡(1:是 0:否)
總體來說,該數(shù)據(jù)集主要由Personal Loan貸款結(jié)果以及一系列用戶的身份資產(chǎn)信息等構(gòu)成
三灵疮、數(shù)據(jù)觀察及清洗
本文數(shù)據(jù)清洗流程上仍然分為初步觀察和清洗兩步织阅,數(shù)據(jù)觀察主要通過以下幾步:
- df.head()——顯示前幾列數(shù)據(jù)
- df.info()——顯示各列數(shù)據(jù)類型
- df.describe()——各列數(shù)據(jù)的描述性統(tǒng)計
針對異常數(shù)據(jù)類型及數(shù)據(jù)問題進(jìn)行修正,修正后重新進(jìn)行描述性統(tǒng)計震捣,觀察數(shù)據(jù)總體特征
四荔棉、 數(shù)據(jù)分析
整體思路:
1 此次活動效果如何?促成了多少人進(jìn)行貸款蒿赢?
2 什么樣的人更傾向于進(jìn)行貸款
- 工作年限對貸款的影響
- 收入對于貸款的影響
- 家庭人數(shù)對于貸款影響......
PART 1 活動效果
活動效果即使是否達(dá)成該目標(biāo)润樱,本案例中的目標(biāo)是進(jìn)行貸款,因此只需要統(tǒng)計Personal Loan 中貸款和沒有貸款的人數(shù)即可
通過此次活動诉植,5000名客戶中有480名客戶開通了貸款業(yè)務(wù)祥国,占比約10%左右昵观,且該活動僅針對未辦理貸款的用戶開展晾腔,總體來說,業(yè)務(wù)提升了10%以上啊犬,效果已經(jīng)相當(dāng)不錯
PART 2 貸款潛在客戶的相關(guān)特征分析
2.1 貸款用戶總體特征
要分析貸款用戶的潛在影響因素灼擂,就是要將是否貸款Personal Loan這一字段與其他字段求出相關(guān)性(corr()函數(shù)),找出相關(guān)系數(shù)最大的值并展示
在此基礎(chǔ)上進(jìn)一步劃分畫板觉至,將各列與personal loan(是否貸款)相關(guān)系數(shù)進(jìn)行可視化展示剔应,得到如下結(jié)果
從圖中可以發(fā)現(xiàn):
1.影響貸款的強相關(guān)變量有:收入、每月信用卡消費額语御、是否有存款賬戶
2.影響貸款的弱相關(guān)變量有:教育程度峻贮、房屋抵押價值、家庭人數(shù)
3.其余因素如郵編应闯、是否有網(wǎng)銀纤控、信用卡、證券賬戶均對貸款無太大影響
4.年齡和工作年限盡管也無顯著影響碉纺,但由于其為連續(xù)性變量船万,不排除某一區(qū)間內(nèi)人群對貸款需求較大,后續(xù)需進(jìn)一步分析
2.2 變量相關(guān)性的進(jìn)一步剖析
在上一步的基礎(chǔ)上將影響貸款的變量進(jìn)一步分析骨田,根據(jù)變量性質(zhì)分開處理
定性變量
將本案例中的變量分為定性與定量耿导,分別探究其與是否貸款的影響,本案例中的定向變量主要有是否存在銀行存款賬戶态贤、教育程度舱呻、家庭人數(shù)等
2.1.1 是否存在銀行存款賬戶
由結(jié)果知,開通了存款賬戶的用戶申請貸款的可能性相較于未開通存款賬戶的用戶整整差了六倍悠汽,因此想辦法讓客戶開通存款賬戶未嘗不是提高貸款率的手段之一
2.1.2 教育程度
隨著學(xué)歷升高狮荔,申請貸款的比例增加胎撇,說明高學(xué)歷用戶更傾向于成為貸款用戶,側(cè)面反映出學(xué)歷越高殖氏,越能接受超前消費的消費觀晚树,越容易成為貸款的潛在用戶
2.1.3 家庭人數(shù)
家庭人數(shù)3-4的客戶相對于1-2的客戶申請貸款可能性更高,側(cè)面反映出隨著家庭成員增加雅采,經(jīng)濟(jì)壓力逐漸加大爵憎,貸款的潛在需求增加,更傾向于使用該業(yè)務(wù)
定量變量
本案例中主要對定量變量中的年領(lǐng)婚瓜、收入宝鼓、信用卡還款額和房屋抵押貸款與是否開通貸款的關(guān)系進(jìn)行探究,由于是定量變量巴刻,區(qū)間為連續(xù)區(qū)間愚铡,相對于定性變量,為便于了解數(shù)據(jù)全貌胡陪,此類變量應(yīng)針對不同區(qū)間分別統(tǒng)計
2.2.1 年齡
綜合來看沥寥,貸款用戶和非貸款用戶年齡差距不大,從具體年齡層來看,32.0-39.0這一年齡段客戶更傾向于貸款
2.2.2 收入
其余定量變量如收入柠座、房屋抵押價值邑雅、每月信用卡消費額的分析過程與年齡這一變量基本相同
總體來看,高收入群體較低收入群體更傾向于貸款妈经,當(dāng)收入超過82淮野,貸款人數(shù)將達(dá)到之前的5倍,超過98吹泡,貸款意愿達(dá)到17%以上骤星,超過170,貸款意愿達(dá)到一半以上爆哑,因此收入越高洞难,貸款業(yè)務(wù)意向越強烈
2.2.3 房屋抵押價值
當(dāng)房屋抵押價值超過109.5后,貸款意愿明顯提高泪漂,總體來看廊营,房屋抵押價值越高,客戶越傾向于貸款
2.2.4 每月信用卡消費額
大部分貸款用戶信用卡消費額平均值接近4萝勤,而未貸款用戶則接近2露筒,足足是兩倍之多,而從用戶分層來看敌卓,信用卡消費額超過2.8千美金之后慎式,貸款概率提升了4倍,超過6千美金,會回落到0.3左右瘪吏,較2.8千美金之前有顯著提升癣防,因此要重點把握每月信用卡消費額大于2.8千美金以上的客戶
五、結(jié)論
通過這次活動掌眠,個人貸款業(yè)務(wù)增長了近10%蕾盯,說明此次推廣活動的效果還是不錯的
對于開通了銀行賬戶的用戶需要加強營銷力度,他們的貸款意愿相對于沒有開通銀行賬戶更強
教育水平越高的客戶越容易接受貸款
家庭人口較多的家庭貸款意愿較強蓝丙,尤其是獨生子女的家庭
年齡區(qū)間在30-40歲的客戶相對貸款意愿更強
相對收入越高级遭,貸款的意愿越強烈, 當(dāng)年收入超過82時渺尘,貸款意愿會有5倍以上的上升挫鸽,超過98時,貸款意愿達(dá)到17%以上鸥跟,超過170時丢郊,貸款意愿達(dá)到一半
當(dāng)房屋抵押值大于190.5千美元時,貸款申請的意愿有明顯的提升
每月消費額在2.8千美元以上的客戶医咨,貸款申請的意愿有明顯的提升