模型結(jié)果轉(zhuǎn)換成信用評分卡档礁,模型區(qū)分度衡量指標
信用評分需要滿足的三點要求
- 控制評分在一定范圍內(nèi),例如0-1000分之內(nèi)
- FICO:300-800
- 正整數(shù)
- 在特定分數(shù)時吝沫,好客戶和壞客戶具有一定的比例關(guān)系odds呻澜,例如希望在評分制為500份時,好客戶和壞客戶的比例為50:1
(平均分數(shù)時惨险,是抽樣比例)
- 有時也被稱為評分校準
- 評分值變動時應(yīng)該能夠反映好客戶和壞客戶比例關(guān)系的變化羹幸,例如希望評分值每增加50分的時候,odds也增加一倍辫愉,
- PDO:points to double the odds,使odds增加一倍所需要增加的分值栅受。
- PTO:points to triple the odds,使odds增加2倍所需要增加的分值。
業(yè)界通用的評分計算公式
- 聯(lián)立求解
- 與logistics回歸結(jié)果結(jié)合(logit是壞樣本的概率)
由于自變量已經(jīng)分箱處理恭朗,所以我們用的自變量其實是分箱之后的WOE
為什么這樣看這里:WOE轉(zhuǎn)換
這樣就是一個線性關(guān)系了
- 對于每一個箱體分箱
- n為變量數(shù)
新增-個人思考
- 首先要理解
:優(yōu)勢比
-
假設(shè)p是某件事情發(fā)生的概率屏镊,這里的p是違約發(fā)生的概率。
-
- 然后是
:證據(jù)權(quán)重
-
(待完善痰腮。而芥。)
-
模型區(qū)分度衡量指標
1.KS(Kolmogorov-Smirnov)
- 是衡量分數(shù)區(qū)分能力的指標
- 橫軸:信用評分值
- 縱軸:累計百分比
- 兩條曲線:
- 分別代表好客戶累計占比和壞客戶累計占比
- 在模型有效的情況下,壞客戶曲線應(yīng)該在好客戶曲線智商
- 這兩條曲線距離越遠膀值,則模型效果越好
- KS=兩條錢的相差最大值
- 一般認為區(qū)分度在30%以上的模型是可以接受的
(今晚問了一個做風(fēng)控的大神棍丐,說是40%弟翘,還說不怎么看roc)
- 一般認為區(qū)分度在30%以上的模型是可以接受的
2. Gini Score
- 數(shù)值越低,表明劃分純度越高
3.Divergence Score離散度評分
模型預(yù)測能力衡量指標
1. AR(Accuracy Ratio)
- 是整體衡量分數(shù)預(yù)測能力的指標
- 需要完整的表現(xiàn)期骄酗,時間上會滯后(新進來樣本的監(jiān)控)
- 取值位于[-1,1]
2. Kendall's Tau(
)
- 衡量分數(shù)升降單調(diào)性的指標
- 如果模型正確,則低分數(shù)段的實際逾期率應(yīng)當(dāng)嚴格大于高分數(shù)段
-
類似于相關(guān)系數(shù)悦冀,用于有序變量間的非參數(shù)相關(guān)性測量指標
- 取值范圍-1~1,絕對值越大則表示關(guān)系強度越高
- 將分數(shù)劃分為十組趋翻,計算各組的逾期率r(重新劃分)
- 如果
的大小關(guān)系和i,j一致,則為同順序?qū)?/li>
- 如果
模型穩(wěn)定性衡量指標
1.PSI(Population Stability Index)
- 人群分布不變時盒蟆,評分卡的計算結(jié)果應(yīng)當(dāng)基本穩(wěn)定
- 按分數(shù)分檔后踏烙,針對不同樣本、或者不同時間的樣本历等,考察各個分數(shù)區(qū)間內(nèi)人數(shù)占總數(shù)的占比是否有明顯變化
- 經(jīng)驗界值
- <10%:無需更新模型
- 10-25%:檢查其他度量方式
- 大于25%:需要更新模型
- 注意:PSI數(shù)值與分段方式有關(guān)讨惩,所以應(yīng)該保持不變
2.遷移矩陣(Migration Matrix):衡量分數(shù)的遷移狀況
- PSI 是針對分數(shù)整體進行考察,對應(yīng)的個體可能并不相同
- 遷移矩陣是對同一個個體進行重復(fù)觀察和比較
- 對相同的人群寒屯,觀察向量兩次監(jiān)控周期中的分數(shù)遷移變化
- 實際計算中可以將分數(shù)段十等分荐捻,然后計算著十組間的遷移矩陣
缺點:只能定性判斷,究竟遷移率達到多少寡夹,很難給出模型穩(wěn)定性的判斷標準
3. 檢查逾期違約率的保守性
- 當(dāng)發(fā)現(xiàn)有分組的逾期違約率低于實際違約率時处面,需要進行二項分布檢驗