Lending Club(以下簡稱LC)是美國的P2P互聯(lián)網(wǎng)消費(fèi)借貸平臺(tái)逛球,可以看做P2P行業(yè)的鼻祖蕴忆。LC創(chuàng)始于2007年仗岖,2008金融危機(jī)期間抓住信貸缺失的機(jī)遇金麸,快速發(fā)展擎析,目前是美國最大的P2P平臺(tái)。關(guān)于LC的業(yè)務(wù)模式參見《Lending Club簡史》讀書筆記--美國P2P行業(yè)發(fā)展淺析
本文結(jié)合kaggle的Lending Club數(shù)據(jù)集挥下,分析了LC的業(yè)務(wù)狀況揍魂、信貸違約,并提出一些業(yè)務(wù)提升的建議棚瘟。
0. 關(guān)鍵結(jié)論與建議
關(guān)鍵結(jié)論:
- LC的P2P貸款業(yè)務(wù)發(fā)展迅速现斋,從2007到2015年年均增長率超過100%,2015年的貸款總量超過60億美元偎蘸;
用戶的單筆貸款金額逐年增加庄蹋,貸款金額主要集中在5000-20000美元的區(qū)間; - 貸款的額度大迷雪、分期數(shù)多(36期限书、60期)、貸款頻率低振乏,主要用途是集合債務(wù)蔗包、換信用卡,用于消費(fèi)場景的比例較小慧邮。貸款利率主要由用戶的信用分和分期數(shù)決定调限,利率集中在10%到20%的區(qū)間。
- LC平臺(tái)的風(fēng)控能力較差误澳,在2007-2015年之間耻矮,貸款的壞賬率高達(dá)17%,實(shí)際收回還款總額是貸款本金的108%忆谓,收益率并不高裆装。
- 風(fēng)險(xiǎn)因素中,違約率隨著貸款信用水平下降而單調(diào)增加倡缠,可見美國的FICO信用評(píng)分就能較準(zhǔn)確地評(píng)估違約風(fēng)險(xiǎn)哨免。
業(yè)務(wù)提升建議:
- LC平臺(tái)的貸款利率已經(jīng)較高,提升業(yè)務(wù)的關(guān)鍵是加強(qiáng)風(fēng)控昙沦,減少壞賬率琢唾,并吸引更多優(yōu)質(zhì)客戶。
- 信用水平最低的F盾饮、G級(jí)別貸款違約風(fēng)險(xiǎn)高采桃、總量少懒熙,且還款的回報(bào)率顯著低于級(jí)別貸款,建議停止發(fā)放此類貸款普办;
- 高收入群體的違約率低工扎、貸款金額大,是LC平臺(tái)的優(yōu)質(zhì)客戶群衔蹲。
建議主動(dòng)吸引更多高收入用戶以LC作為貸款融資渠道肢娘,通過提升客戶質(zhì)量來降低貸款不良風(fēng)險(xiǎn) - 發(fā)放的貸款的主要分布在B/C/D等級(jí),通過機(jī)器學(xué)習(xí)模型踪危,尋找信用分之外的違約因素蔬浙,控制主要客戶群的違約風(fēng)險(xiǎn)水平;
- LC當(dāng)前的分期模式只支持36期和60期贞远,建議設(shè)置12/24月分期的貸款產(chǎn)品畴博,滿足更多短期、高頻的消費(fèi)貸款需求蓝仲,提升用戶復(fù)用率俱病,擴(kuò)大業(yè)務(wù)量;
1. 數(shù)據(jù)描述
Lending Club(LC)的數(shù)據(jù)見:https://www.kaggle.com/wendykan/lending-club-loan-data
kaggle提供的數(shù)據(jù)包含從2007年到2015年的發(fā)放的887k貸款記錄袱结,每個(gè)貸款記錄有75個(gè)維度的特征亮隙。
主要的數(shù)據(jù)特征及語義:
特征 | 語義 | 備注 |
---|---|---|
issue_d | 貸款發(fā)放時(shí)間 | 年-月 |
grade | LC的信用評(píng)級(jí) | 主要根據(jù)FICO分和貸款數(shù)額、期限確定 |
int_rate | LC發(fā)放貸款利率 | 主要由grade評(píng)級(jí)決定 |
annual_inc | 年收入 | 體現(xiàn)還款能力 |
loan_amnt | 貸款數(shù)額 | |
term | 分期期數(shù) | 36期(3年)垢夹,60期(5年) |
loan_status | 貸款狀態(tài) | 正常溢吻、逾期、違約 |
delinq_2yrs | 2年內(nèi)的錢款 | 最近的信用記錄 |
inq_last_6mths | 過去6個(gè)月果元,信用記錄被查詢次數(shù) | 可能意味著向其他機(jī)構(gòu)申請(qǐng)貸款未批準(zhǔn) |
home_ownership | 住房狀態(tài) | 自有促王、租房、按揭 |
desc | 借款描述 | 文本信息而晒,需要NLP處理 |
dti | LC以外需要還款的數(shù)額 | |
emp_title | 職業(yè)職位 | 可以考慮對(duì)職業(yè)分群 |
emp_length | 職業(yè)年限 | 數(shù)值型 |
以上數(shù)據(jù)維度較為豐富蝇狼,數(shù)據(jù)應(yīng)用需要注意的問題:
- 一些重要信息沒有包括,如年齡倡怎、性別迅耘、婚姻狀態(tài)、FICO信用分?jǐn)?shù)监署,可能考慮隱私保護(hù)颤专;
這些信息在實(shí)際風(fēng)控中非常重要; - 貸款狀態(tài)描述當(dāng)前的情況钠乏,已經(jīng)放款的貸中項(xiàng)目血公,其最終是否違約不確定的,因此直接計(jì)算得到的違約率是偏低的缓熟;
2. LC借貸業(yè)務(wù)整體分析
數(shù)據(jù)期限從2007年6月到2015年12月累魔,共8年半。
2.1 業(yè)務(wù)總量
LC在截至2015年底的8年半中够滑,總共發(fā)放的貸款筆數(shù)為887k垦写。逐年的貸款總量和筆數(shù)如下圖:
可以看出,貸款筆數(shù)和貸款總量均呈現(xiàn)逐年快速增加的趨勢彰触,2015年發(fā)放貸款總量超過60億美元梯投,超過40萬筆。
按月份統(tǒng)計(jì)的貸款量增長如下:
注意到在2014年以前况毅,貸款量的增長曲線非常平滑分蓖,在2014年6月之后,新增貸款量出現(xiàn)非常大的波動(dòng)尔许,大致呈現(xiàn)出每3個(gè)月出現(xiàn)一個(gè)貸款量高峰的模式么鹤。
在2014-2015的詳圖中,從2014年7月起味廊,每隔1個(gè)季度蒸甜,出現(xiàn)一次貸款高峰。在貸款高峰月余佛,未發(fā)現(xiàn)美國利率和資本市場有異常情況柠新,因此可能的解釋為:由于某種政策的影響,每個(gè)季度開始的月份辉巡,是美國消費(fèi)者債務(wù)整合操作的高峰時(shí)期恨憎。
在實(shí)際業(yè)務(wù)中,如果遇到這樣的資金需求量波動(dòng)周期郊楣,應(yīng)該挖掘出背后的因素憔恳,以便提前籌備資金。
2.2 單筆貸款
從2007年到2015年痢甘,左圖看出平均單筆貸款的額度從8254美元增加到15240美元喇嘱,單筆額度逐年增加。這一趨勢與貸款人年均收入逐年增加(右圖)的趨勢對(duì)應(yīng)塞栅,顯示了借款人和投資人的信心均隨著金融危機(jī)后美國經(jīng)濟(jì)復(fù)蘇而增強(qiáng)者铜。
單筆貸款金額分布如:
可以注意到:
- 最小的單筆額度為500美元
- 最大額度在2007-2010年為25000美元,在2011年之后放椰,最大額度調(diào)整為35000美元
- 在整數(shù)額度(5k作烟、10k等),借貸筆數(shù)出現(xiàn)高峰砾医,體現(xiàn)出借款用戶金額湊整的心態(tài)
- 貸款額度主要分布在5000-20000美元的區(qū)間
2.3 利率與分期
LC的貸款分期數(shù)只有2個(gè)檔次:3年分期(36月)拿撩、5年分期(60月)。貸款的利率主要由grade評(píng)級(jí)如蚜、貸款額度压恒、分期數(shù)決定影暴。對(duì)同一個(gè)人,申請(qǐng)同一額度探赫,如果分期數(shù)增加型宙,貸款評(píng)級(jí)會(huì)下調(diào),即利率增大伦吠。
所有貸款項(xiàng)目妆兑,最低利率5.32%,最高利率28.99%毛仪,平均值在13.25%.
可以看出:
- 貸款項(xiàng)目的利率主要分布在10%到20%的區(qū)間搁嗓;
- 2007年的項(xiàng)目最高利率不超過18%,后續(xù)利率的上限達(dá)到了29%箱靴;
- 與國內(nèi)的個(gè)人貸款項(xiàng)目相比腺逛,利息是偏高的如,
- 借唄日利息萬2.5到萬5(年化9.1%-18.25)刨晴,
- 微信微粒貸年化18.25%
貸款平均利率在不同年份有顯著變化:
對(duì)比不同分期數(shù)的利率設(shè)置:
- 不同分期屉来,利率的上下限沒有顯著變化
- 分36期的貸款利率均12.02%,顯著小于分60期的利率均值16.11%
對(duì)比不同評(píng)級(jí)分組的貸款利率狈癞,評(píng)級(jí)主要根據(jù)FICO信用分茄靠,將貸款項(xiàng)目分為A-G的等級(jí),信用依次降低蝶桶,利率依次增大慨绳。
可以看出,
- 不同grade組平均利率呈現(xiàn)顯著的臺(tái)階真竖;
- 但最低貸款利率除了G以為區(qū)別不大脐雪。可能較低評(píng)級(jí)的貸款在特定的情況下恢共,也會(huì)取得較低利益战秋;
- 從數(shù)量上的來看,A-D等級(jí)的貸款占了貸款筆數(shù)的90%以上讨韭,E-G等級(jí)越低的貸款脂信,數(shù)量越少;
看一看出平臺(tái)對(duì)申請(qǐng)貸款的準(zhǔn)入門檻較高透硝,低等級(jí)貸款發(fā)放量很少狰闪。
2.4 貸款用途
申請(qǐng)貸款必須填寫貸款的用途,最常見的用途是集合債務(wù)貸款濒生,或者償還高利息的信用卡貸款埋泵。
其余的用途有: 房屋裝修、婚禮、汽車丽声、小生意礁蔗、教育培訓(xùn)。
可以看出集合債務(wù)和信用卡是貸款的主要用途雁社,其余的選項(xiàng)占比很少瘦麸。
2.5 用戶行為分析
嘗試分析LC貸款用戶的重復(fù)貸款行為,檢查數(shù)據(jù)集中的member_id,發(fā)現(xiàn)沒有重復(fù)的。這意味著所有的用戶在2007-2015年燕酷,在LC平臺(tái)上只有一次貸款鼎姊。這一結(jié)論不符合預(yù)期,在《Lending Club簡史》中箍鼓,存在一些用戶長期在LC上融資崭参。猜測數(shù)據(jù)可能存在的問題是:
- LC放出公開數(shù)據(jù)時(shí),只保留了一個(gè)用戶ID的一次貸款行為款咖;
- 處于隱私保護(hù)的考慮何暮,修改了同一個(gè)用戶在不同貸款項(xiàng)目的member_id;
從貸款額度和分期的角度來看,LC平臺(tái)的貸款度平均在1萬美元以上铐殃,分期至少36期海洼。尤其在分期上缺乏彈性,可以推測貸款用戶只有融資需求較大時(shí)富腊,才會(huì)在LC平臺(tái)貸款坏逢。因此用戶行為總體是:大額、低頻赘被。這種模式可能造成老用戶的活躍度不高是整。
3. 貸款違約分析
對(duì)于各種貸款狀態(tài),劃分為:
- Bad民假,不良/壞賬
- Late浮入,逾期
- Good,完成還款
- Cur羊异,貸中
貸款狀態(tài) | 語義 | Bad | Late | Good | Cur |
---|---|---|---|---|---|
Current | 貸中 | - | - | - | Y |
Fully Paid | 全額還款 | - | - | Y | - |
Default | 違約 | Y | - | - | - |
Charged Off | 壞賬 | Y | - | - | - |
Issued | 發(fā)布 | - | - | - | Y |
In Grace Period | 寬限期(逾期15天之內(nèi)) | - | Y | - | - |
Late (16-30 days) | 逾期16-30天 | - | Y | - | - |
Late (31-120 days) | 逾期31-120天 | _ | Y | - | - |
Does not meet the credit policy. Status:Fully Paid | 全額還款(不符合信用) | - | - | Y | - |
Does not meet the credit policy. Status:Charged Off | 壞賬(不符合信用) | Y | - | - | - |
3.1 貸款風(fēng)險(xiǎn)與資損情況分析
各年度貸款統(tǒng)計(jì)如下:
- bad_ratio事秀,除去貸中(Current)之后的壞賬比例
- cur_ratio,貸中的比例
- ratio_pymnt球化,總還款額率=(本金+利息)/總貸款額
- ratio_prncp秽晚,本金償還率= 償還本金/總貸款額
可以看出:
- 2007-2009年的貸款沒有Current
- 2007-2008,貸款不良率超過20%筒愚,本金回收率只有0.78和0.80赴蝇,總體上有資金損失;
- 2009年巢掺,貸款不良率在14%句伶,總體還款/本金比率為1.08劲蜻,即總體上是有收益的。
- 2010-2012年考余,current狀態(tài)的貸款先嬉,比例不超過10%
- 總體還款/本金比率為1.08
- 貸款不良率穩(wěn)定在0.14-0.16,本金收回率在0.87
- 2013-2015年楚堤,大量的貸款處于Current疫蔓,因此回收資金的比例很低。
貸中項(xiàng)目最終可能發(fā)展為Bad/Good/Late中的一類身冬,當(dāng)前的貸款不良率沒有反應(yīng)真實(shí)的違約狀況衅胀。
需要注意的是,Bad貸款并不意味著資金全部損失酥筝,實(shí)際上貸款用戶會(huì)在分期還款的一定階段出現(xiàn)逾期滚躯,最終壞賬不再還款。統(tǒng)計(jì)Bad貸款可以收回的本金比例在43.7%嘿歌,即平均損失月60%的本金掸掏。
壞賬貸款停止還款的期數(shù)分布如下,平均在14分期是發(fā)生違約宙帝。
3.2 貸款風(fēng)險(xiǎn)與信用等級(jí)
貸款評(píng)級(jí)分析
LC貸款數(shù)據(jù)中丧凤,貸款評(píng)級(jí)grade直接體現(xiàn)了信用等級(jí)。不同等級(jí)的貸款不良率如下:
隨著grade降級(jí)貸款的不良率單調(diào)增加茄唐,這說明了美國的FICO信用評(píng)價(jià)是非诚⒙悖可靠的。E-G級(jí)別貸款的不良率很高沪编,但從貸款總量上來看呼盆,占比并不大。因此要控制總體的貸款不良率蚁廓,主要還是應(yīng)該從B访圃、C級(jí)別的貸款入手。
收入水平分析
對(duì)借款人的收入水平分級(jí):
- 年收入<10w美元:low
- 年收入在10w和20w美元之間:medium
- 年收入大于20w美元:high
可以看出:
- 在統(tǒng)計(jì)意義上相嵌,高收入群體的貸款不良率更低腿时;
- 從貸款數(shù)額上看,高收入群體的貸款額度也更大饭宾;
在LC的用戶群中批糟,高收入群體可以作為優(yōu)質(zhì)用戶。
需要注意的是看铆,高收入并不等價(jià)于高信用徽鼎,依然存在E-G低信用評(píng)級(jí)的貸款。
3.3 貸款風(fēng)險(xiǎn)與分期數(shù)
LC的貸款分期數(shù)只有36月和60月分期兩種,分析兩種分期模式下貸款的不良率:
從統(tǒng)計(jì)上來看否淤,60月分期的貸款不良率顯著高于36月分期的貸款悄但。綜合分期數(shù)和貸款等級(jí),如下:
注意到:
- A-D評(píng)級(jí)較高的貸款中石抡,分期36的數(shù)量多于分期60
- E-G評(píng)級(jí)較低的貸款中檐嚣,分期60月的貸款比例很高
即由于更多的高風(fēng)險(xiǎn)貸款選擇了60月分期,使得60月分期貸款的總體不良率更高啰扛。對(duì)比各等級(jí)貸款嚎京,在不同分期數(shù)下的不良率,注意到各等級(jí)的貸款隐解,采用60月分期的貸款總體比36月分期的不良率更低挖藏。
3.4 貸款用途與使用目的
最常見的用途是集合債務(wù)貸款,或者償還高利息的信用卡貸款厢漩。其余的用途有: 房屋裝修、婚禮岩臣、汽車溜嗜、小生意、教育培訓(xùn)架谎。
不同目的貸款的不良率如:
注意到:
- 貸款不良率最高的類別是教育(20.8%)和小生意(17.16%)
- 集合債務(wù)炸宵、信用卡是貸款量最大的業(yè)務(wù),不良率相對(duì)較低谷扣,即主營業(yè)務(wù)風(fēng)險(xiǎn)可控性強(qiáng)
為何用于教育培訓(xùn)的貸款不良率是最高的呢土全?教育類貸款總共423筆,其中88筆不良会涎,發(fā)放年份集中在2007-2010年裹匙,2010年之后幾乎沒有再發(fā)放教育類貸款∧┩海可能的原因分析:
- 2007-2010年是金融危機(jī)之后就業(yè)形勢總體較差的時(shí)期概页,在這一階段貸款用于教育,很可能投入的資金難以取得回報(bào)
- 可能由于教育類貸款總體風(fēng)險(xiǎn)太高练慕,LC在2010年之后惰匙,基本停止了教育類貸款的發(fā)放
3.5 其他因素的分析
對(duì)其他因素的分析沒有發(fā)現(xiàn)與貸款不良率有較強(qiáng)的相關(guān)性。
-
貸款額度
-
貸款人住址地域
此處的地域分類為美國各州的東南铃将、東北等大區(qū)域
可以看出项鬼,貸款額度、貸款人地域等因素對(duì)貸款不良率幾乎沒有影響劲阎。
4. 貸款收益比分析
信用等級(jí)高的貸款绘盟,風(fēng)險(xiǎn)低,利率收益低;反之奥此,信用等級(jí)低的貸款弧哎,風(fēng)險(xiǎn)高,利息收益也高稚虎。那么實(shí)際運(yùn)行中撤嫩,哪些群體的貸款最終收益更高呢?以最終收回的還款比例衡量:
-
不同等級(jí)貸款蠢终,/C/D等級(jí)貸款的收益最高序攘,而低信用的F/G等級(jí)貸款,收益最低寻拂;
-
不同收入群體程奠,高收入群體的貸款收益最好
因此在業(yè)務(wù)策略上,建議停止發(fā)放低信用的F/G等級(jí)貸款祭钉,在客戶群上多吸引高收入優(yōu)質(zhì)客戶群體瞄沙。