標(biāo)準(zhǔn)評分卡
評分卡的類型和目的
如今在銀行神郊、消費金融公司等各種貸款業(yè)務(wù)機構(gòu),普遍使用信用評分宅静,對客戶實行打分制章蚣,以期對客戶有一個優(yōu)質(zhì)與否的評判。但是不是所有人都知道信用評分卡還分A,B,C卡三類姨夹∠舜梗互聯(lián)網(wǎng)金融中的信貸模型常用信用評分卡模型矾策,信用評分卡主要分為三類:
- A卡,申請評分卡洒忧, 對信貸款申請進(jìn)行篩選并判斷其違約風(fēng)險
- B卡,行為評分卡够颠,對審批通過的貸款賬戶進(jìn)行覆蓋整個貸款周期的管理
- C卡熙侍,催收評分卡,對逾期帳戶預(yù)測催收策略反應(yīng)的概率履磨,從而采取相應(yīng)的催收措施
本文主要介紹前兩種評分卡蛉抓。
申請評分卡的評分結(jié)果將決定以下幾個方面:
- 估計的信用狀況(正常or違約,批準(zhǔn)or拒絕)
- 為了獲得審批通過需要抵押的物品
- 貸款金額(信用額度)
- 貸款定價(利率水平)
行為評分卡的評分結(jié)果將決定以下幾個方面:
- 審查信用重建
- 制定清收策略(若違約或逾期)
- 審查貸款定價或貸款條件
兩種評分卡的開發(fā)過程存在著兩個主要的差別:
- 通常剃诅,行為評分卡要比申請評分卡更為準(zhǔn)確巷送,因為行為評分卡在對賬戶狀態(tài)進(jìn)行預(yù)測時基于更多的數(shù)據(jù)(交易狀態(tài))
- 拒絕演繹技術(shù)只在申請評分卡的開發(fā)過程中使用。
正常矛辕,違約和不確定
簡單介紹M1笑跛,M2,M3:
M1時段:是M0時段的延續(xù)聊品,即在未還款的第二個賬單日到第二次賬單的最后繳款日之間飞蹂。
M2時段:是M1的延續(xù),即在未還款的第三個賬單日到第三次賬單的最后繳款日之間翻屈。
M3時段:是M2的延續(xù)陈哑,即在未還款的第四個賬單日到第四次賬單的最后繳款日之間。
明確正常和違約的含義之后伸眶,用于評分卡模型開發(fā)的數(shù)據(jù)中必須包含一個表示賬戶觀測值的變量惊窖,即狀態(tài)變量或指標(biāo)。通常厘贼,用1表示違約界酒,0表示正常。不確定賬戶狀態(tài)定義于介于違約和正常之間的另外一種狀態(tài)變量嘴秸,可作多分類盾计,此種情況。
本文討論二分類問題赁遗,即用1表示違約署辉,0表示正常。
評分卡開發(fā)流程
問題準(zhǔn)備
在此階段岩四,需要做出下列決策和解決下列問題:
- 在特定業(yè)務(wù)重點哭尝,財務(wù)結(jié)果和具體信貸產(chǎn)品歷史表現(xiàn)的基礎(chǔ)上,確定違約和正常的定義剖煌;
- 確定計劃的評分卡的范圍材鹦、開發(fā)和實施窗口逝淹;
- 識別數(shù)據(jù)來源和范圍,內(nèi)部還是外部桶唐,并確保數(shù)據(jù)能夠獲日て稀;
- 設(shè)計主要項目管理計劃尤泽,對時間欣簇,資源和人員進(jìn)行管理。
數(shù)據(jù)獲取和整合
數(shù)據(jù)不限制內(nèi)部坯约,也可以來源于外部數(shù)據(jù)熊咽,需要整合成一個適合建模的數(shù)據(jù)。
基于客戶開發(fā)的評分卡通常適用于客戶級的評分闹丐。后面會專門些如何進(jìn)行數(shù)據(jù)獲取和整合横殴。
EDA和數(shù)據(jù)描述
- 候選預(yù)測變量單變量統(tǒng)計特征的平均,及其取值在變量范圍內(nèi)的分布卿拴;
- 計算每個候選預(yù)測變量分類或分段條件下的違約率分布衫仑,也被稱為要素分析;
- 通過列聯(lián)表堕花、關(guān)聯(lián)表和相關(guān)性指標(biāo)確定不同變量之間的檢驗關(guān)系惑畴。
數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備是整個評分卡開發(fā)過程中最重要,也是最耗時的工作航徙。約占整個項目時間的80%以上如贷。
數(shù)據(jù)準(zhǔn)備的目的就是創(chuàng)建所謂的數(shù)據(jù)挖掘或建模視圖,即包含開發(fā)評分卡模型所需要的所有要素的唯一數(shù)據(jù)集到踏。需要大量的數(shù)據(jù)清洗及轉(zhuǎn)換工作杠袱。
關(guān)注證據(jù)權(quán)重(WOE)!
變量選擇
窝稿?楣富? 變量選擇or特征工程
模型開發(fā)
標(biāo)準(zhǔn)評分卡基于logistic回歸模型。現(xiàn)在有各種評分卡模型了.......
模型驗證
所有預(yù)測模型都需要滿足四項基本要求:
- 必須達(dá)到可接受的準(zhǔn)確水平
- 必須穩(wěn)健伴榔,能夠適用于更廣范圍的數(shù)據(jù)集
- 必須簡單纹蝴,或具有數(shù)學(xué)意義上的簡潔
- 必須有意義,即在業(yè)務(wù)變量和預(yù)測值上是可解釋的
評分卡的創(chuàng)建和刻度
在logistic回歸模型中對自變量進(jìn)行證據(jù)權(quán)重有兩項好處:
- 可以將名義變量和分段的連續(xù)變量納入logistic回歸模型踪少,從而塘安,每個原始變量都是以唯一的值納入模型,省去了虛擬變量援奢,并使實際模型參數(shù)保持較小的取值兼犯。
- 可以將標(biāo)準(zhǔn)評分卡形式表示logistic回歸模型,后續(xù)可作二分類問題推廣。
評分卡實施
將評分卡轉(zhuǎn)化成可實施代碼切黔,如sas砸脊,sql、python等纬霞;確定最終得分的臨界值凌埂,以對應(yīng)所需的業(yè)務(wù)行動,例如接受诗芜、拒絕或參考人工審核結(jié)果瞳抓。
拒絕演繹
拒絕演繹并不是評分卡開發(fā)過程中的標(biāo)準(zhǔn)步驟;評分卡開發(fā)使用的是已經(jīng)審批通過且經(jīng)過一段時間運行的賬戶數(shù)據(jù)绢陌,已經(jīng)表現(xiàn)出正嘲は拢或違約的賬戶狀態(tài)熔恢,因此脐湾,被拒絕申請的數(shù)據(jù)沒有被納入評分卡開發(fā)過程中;拒絕演繹是嘗試去分析可能會違約并在評分卡開發(fā)前已經(jīng)被拒絕的賬戶的一種方法叙淌。
第一章就到這兒了秤掌,后續(xù)接著碼代碼.......