信用評分工具
在傳統(tǒng)的信貸審核中蔚龙,通常由信貸審批經(jīng)理根據(jù)自身經(jīng)驗同時基于借款人提交的資料進行審批判斷,顯然隨著計算機及互聯(lián)網(wǎng)的普及人工審批在時效上和效率上顯出弊端。信用評分正是出于解決這些問題峭弟。
信用評分模型是評估貸款申請人的資信狀況來預(yù)測申請人未來驗證拖欠或壞賬概率的模型。
最有效的風險管理莫過于把風險過高而收益不能對稱的申請者拒之門外脱拼,因為一旦高風險的申請人獲得信貸瞒瘸,其他管理手段只能減少損失而不能避免損失。有研究表明熄浓,80%的風險來自申請階段情臭,而申請后(貸中、貸后)風險管理只能管理到20%的風險赌蔑。
信用評分模型的含義
信用評分模型實際上是一種用于個人信用風險控制的數(shù)學模型俯在,它利用數(shù)據(jù)挖掘技術(shù),對金融機構(gòu)大量客戶的歷史數(shù)據(jù)進行分析娃惯,尋找有關(guān)客戶信用風險的特征和規(guī)律跷乐,建立相應(yīng)的數(shù)學模型,對新申請者或已有客戶評估風險趾浅。如申請風險評分模型愕提、行為評分模型馒稍、催收評分模型、欺詐風險評分模型等浅侨。
信用評分卡的開發(fā)流程
模型樣本
選取好的樣本是開發(fā)模型的首要環(huán)節(jié)纽谒。建立預(yù)測模型的前提是客戶未來的行為模式與過去相似,而且這種行為模式可以用恰當?shù)慕y(tǒng)計技術(shù)提煉和總結(jié)出來如输,所以可以用過去的數(shù)據(jù)來預(yù)測未來鼓黔。
隨機抽樣:是在確定樣本規(guī)模后從總體中完全隨機的抽取,每種類型的個體在樣本中的比例與在總體中的比例是一樣的挨决。
分類抽樣:首先根據(jù)模型的需要確定樣本的類別请祖,對每一類別的樣本分別確定其抽樣個數(shù)订歪,然后在每一類別內(nèi)部隨機抽取所需的樣本脖祈。由于每一類別的抽樣比例可能不一樣,所以必須給每個樣本類別設(shè)置相應(yīng)的樣本加權(quán)數(shù)刷晋。例如:有100萬個賬戶盖高,“壞”的賬戶占2%(98萬個好賬戶,2萬個壞賬戶)眼虱,從中分類抽樣“好”賬戶7000個作樣本喻奥,樣本加權(quán)數(shù)為980000/7000=140(每個“好”的樣本個體代表總體中140個同樣的好個體);從“壞”賬戶里抽取3000個作樣本捏悬,樣本加權(quán)數(shù)為20000/3000=6.67(每個“壞”的樣本個體代表總體中6.67個同樣的壞個體)撞蚕。
在絕大多數(shù)的模型開發(fā)中,所用的方法都是分類抽樣过牙。為了使樣本量充足甥厦,一般“好”的樣本在2000-3000個以上,“壞”的樣本在1000-1500個以上寇钉。
模型變量
評分模型的變量主要有兩種:表現(xiàn)變量(因變量Y)和預(yù)測變量(自變量X)刀疙。
表現(xiàn)變量是模型所要預(yù)測的結(jié)果。預(yù)測變量體現(xiàn)著與目標變量的相關(guān)性和邏輯因果關(guān)系扫倡,來源于申請表中的原始數(shù)據(jù)及征信記錄谦秧。
以申請評分模型的為例:
1.表現(xiàn)變量
3期拖欠以上、呆賬撵溃、破產(chǎn)的賬戶定義為“壞”疚鲤;
未拖欠或1期拖欠的賬戶定義為“好”;
2期拖欠的賬戶定義為“不確定”缘挑,被排除于模型之外集歇;
具體
2.預(yù)測變量
反映申請者未來還款能力、還款意愿及穩(wěn)定性卖哎。
一是申請表上申請人信息鬼悠,如年齡删性、性別、學歷焕窝、職業(yè)蹬挺、收入、是否擁有房產(chǎn)等信息它掂;
二是關(guān)于汽車貸款本身的信息巴帮,如首期付款額、貸款價值比虐秋、貸款期限長短等榕茧;
三是申請人在征信機構(gòu)的信用歷史記錄信息絮姆。
模型分組
分組是把總體數(shù)據(jù)分成幾個具備同質(zhì)性的群體鸭栖,群體內(nèi)部的賬戶具備相似的行為特征,群體之間的行為特征差別較大报慕,最終從候選變量中以數(shù)理統(tǒng)計方法選擇若干變量組成完整評分卡靶剑。
模型制定
在確定了樣本蜻拨、界定了表現(xiàn)變量、提煉了預(yù)測變量桩引、決定了模型分組之后缎讼,下一步就是以適當?shù)慕y(tǒng)計方法制定具體的評分模型了。
1)分析單個變量的預(yù)測能力
分析單個變量的預(yù)測能力坑匠,其目的是發(fā)現(xiàn)具備強大預(yù)測能力的變量作為模型的候選變量血崭,剔除不具備預(yù)測力或預(yù)測力極其微弱的變量,以縮小候選變量的范圍厘灼。
分析單個變量的預(yù)測能力
把過去6個月的平均付款比例劃分成8個欄位夹纫,每個欄位都有一定數(shù)量的好賬戶和壞賬戶,從“壞”的比例上看手幢,0%付款比例的壞賬率最高捷凄,達14%,隨著付款比例的提高围来,壞賬率逐步下降跺涤,付款率達100%的賬戶群,其壞賬率最低监透,不到1%桶错。我們看到這個變量能有效地分辨表現(xiàn)變量,其預(yù)測力強胀蛮。如果反過來院刁,各個欄位的壞賬率大體相同,或無規(guī)律可循粪狼,則說明沒有多少預(yù)測力退腥,可以刪除任岸。
2)減少候選變量的數(shù)量
通過分析保留下來的具備較強預(yù)測力的候選變量數(shù)目往往還是很龐大,必須把候選變量進一步分組狡刘,每一組之內(nèi)變量間的相關(guān)性很高享潜,組與組之間變量的相關(guān)性很低。然后從每一組變量中選擇預(yù)測力最強嗅蔬、信息最有效的一個變量作為模型候選之用剑按,這樣可以大大減少候選變量的數(shù)目。
可以用來進行變量分組的常用統(tǒng)計方法有相關(guān)系數(shù)分析澜术、變量類聚分析艺蝴、因子分析、主成分分析等鸟废;
3)選擇適當?shù)哪P头椒?/p>
具體模型方法的選擇必須根據(jù)模型的性質(zhì)猜敢、分析人員的經(jīng)驗和技能、系統(tǒng)實施的方便程度來決定侮攀。例如锣枝,對于申請評分模型厢拭,最流行的是邏輯回歸模型兰英,對于欺詐風險評分模型應(yīng)用神經(jīng)網(wǎng)絡(luò)模型較多,對于催收評分策略應(yīng)用決策樹模型較多供鸠。
4)確定模型的變量組合和權(quán)重
不管運用何種統(tǒng)計方法畦贸,最終從候選變量中選擇一定組合(通常8-15個變量),進入最終的模型楞捂,并且根據(jù)統(tǒng)計原理分配相應(yīng)的評分權(quán)重薄坏。例如行為評分中從反映歷史拖欠行為、消費行為寨闹、欠款行為胶坠、付款行為等各方面選擇一些預(yù)測變量強、相關(guān)性低的變量構(gòu)成一個信息量豐富的變量組合繁堡。
模型校驗
在完成模型的制定以后沈善,如何衡量模型預(yù)測能力的強弱呢?一般來說椭蹄,在模型的開發(fā)階段闻牡,模型的檢驗有兩種方式:樣本內(nèi)檢驗和樣本外檢驗。
利用模型開發(fā)所用的樣本來對比預(yù)測情況與實際情況的差別绳矩,屬于樣本內(nèi)檢驗罩润;
利用事先預(yù)留的、不用于模型開發(fā)而只用于模型檢驗的樣本來對比預(yù)測情況與實際情況的差別翼馆,屬于樣本外檢驗割以;一般來說金度,預(yù)留的樣本占總樣本的20%-30%。
常用的模型檢驗方法有:
- 交換曲線
- K-S指標
- 區(qū)分度
- 擬合度曲線
前三者主要檢測模型對好賬戶和壞賬戶排隊區(qū)分的效果严沥,即隨著評分的上升审姓,好的比例也上升,低分和高分有效地把壞賬戶和好賬戶區(qū)分開來祝峻。擬合度曲線則對比預(yù)測壞賬率與實際的壞賬率之間的準確程度魔吐。通常信用評分模型的首要目標是好壞的區(qū)分效果,其次才是預(yù)測的精確程度莱找,因為哪怕模型預(yù)測壞的概率不夠精確酬姆,但如果能有效地把好賬戶和壞賬戶區(qū)分開來,瞄準和開拓好賬戶奥溺、拒絕壞賬戶辞色,也能達到利用模型進行風險管理的首要目的。