數(shù)據(jù)分析案例(四)——評分卡模型(三)

模型結(jié)果轉(zhuǎn)換成信用評分卡档礁,模型區(qū)分度衡量指標

信用評分需要滿足的三點要求

  1. 控制評分在一定范圍內(nèi),例如0-1000分之內(nèi)
  • FICO:300-800
  • 正整數(shù)
  1. 在特定分數(shù)時吝沫,好客戶和壞客戶具有一定的比例關(guān)系odds呻澜,例如希望在評分制為500份時,好客戶和壞客戶的比例為50:1
    (平均分數(shù)時惨险,是抽樣比例)
  • 有時也被稱為評分校準
  1. 評分值變動時應(yīng)該能夠反映好客戶和壞客戶比例關(guān)系的變化羹幸,例如希望評分值每增加50分的時候,odds也增加一倍辫愉,
  • PDO:points to double the odds,使odds增加一倍所需要增加的分值栅受。
  • PTO:points to triple the odds,使odds增加2倍所需要增加的分值。

業(yè)界通用的評分計算公式

Score = Offset + Factor \times ln(odds)
Score + PDO = Offset + Factor \times ln(2\times odds)

  • 聯(lián)立求解
    Factor = PDO / ln(2)
    Offset = BaseScore - Factor \times ln(odds)
  • 與logistics回歸結(jié)果結(jié)合(logit是壞樣本的概率)
    ln(odds) = -logit(P) = -(\alpha + \sum{(\beta \times WOE)})
    由于自變量已經(jīng)分箱處理恭朗,所以我們用的自變量其實是分箱之后的WOE
    為什么這樣看這里:WOE轉(zhuǎn)換

這樣就是一個線性關(guān)系了

  • 對于每一個箱體分箱Score = Offset/n -Factor \times (\alpha/n+ \beta \times WOE)
    • n為變量數(shù)

新增-個人思考

  • 首先要理解Odds:優(yōu)勢比
    • Odds = p/(1-p)
      假設(shè)p是某件事情發(fā)生的概率屏镊,這里的p是違約發(fā)生的概率。
  • 然后是WOE:weight \ of \ evidence:證據(jù)權(quán)重
    • WOE = ln(Bad#)
      (待完善痰腮。而芥。)

模型區(qū)分度衡量指標

1.KS(Kolmogorov-Smirnov)

  • 是衡量分數(shù)區(qū)分能力的指標
  • 橫軸:信用評分值
  • 縱軸:累計百分比
  • 兩條曲線:
    • 分別代表好客戶累計占比和壞客戶累計占比
    • 在模型有效的情況下,壞客戶曲線應(yīng)該在好客戶曲線智商
    • 這兩條曲線距離越遠膀值,則模型效果越好
  • KS=兩條錢的相差最大值
    • 一般認為區(qū)分度在30%以上的模型是可以接受的
      (今晚問了一個做風(fēng)控的大神棍丐,說是40%弟翘,還說不怎么看roc)

2. Gini Score

  • Gini=2\sum{\frac{n}{N}(1-p_{i})p_{i}}
  • 數(shù)值越低,表明劃分純度越高

3.Divergence Score離散度評分

  • Divergence=\frac{( \mu_{good} - \mu_{bad})^{2}}{(VAR_{good}+VAR_{bad})/2}

模型預(yù)測能力衡量指標

1. AR(Accuracy Ratio)

  • 是整體衡量分數(shù)預(yù)測能力的指標
  • 需要完整的表現(xiàn)期骄酗,時間上會滯后(新進來樣本的監(jiān)控)
  • 取值位于[-1,1]

2. Kendall's Tau(\tau

  • 衡量分數(shù)升降單調(diào)性的指標
  • 如果模型正確,則低分數(shù)段的實際逾期率應(yīng)當(dāng)嚴格大于高分數(shù)段
  • \tau類似于相關(guān)系數(shù)悦冀,用于有序變量間的非參數(shù)相關(guān)性測量指標
  • 取值范圍-1~1,絕對值越大則表示關(guān)系強度越高
  • 將分數(shù)劃分為十組趋翻,計算各組的逾期率r(重新劃分)
    • 如果r_{i},r_{j}的大小關(guān)系和i,j一致,則為同順序?qū)?/li>
    • \tau=\frac{同順序?qū)ψ訑?shù)-異順序?qū)ψ訑?shù)}{n(n-1)/2}

模型穩(wěn)定性衡量指標

1.PSI(Population Stability Index)

  • 人群分布不變時盒蟆,評分卡的計算結(jié)果應(yīng)當(dāng)基本穩(wěn)定
  • 按分數(shù)分檔后踏烙,針對不同樣本、或者不同時間的樣本历等,考察各個分數(shù)區(qū)間內(nèi)人數(shù)占總數(shù)的占比是否有明顯變化
  • PSI= \sum{[(Ac-Ex)*ln(\frac{Ac}{Ex})]}
  • 經(jīng)驗界值
    • <10%:無需更新模型
    • 10-25%:檢查其他度量方式
    • 大于25%:需要更新模型
  • 注意:PSI數(shù)值與分段方式有關(guān)讨惩,所以應(yīng)該保持不變

2.遷移矩陣(Migration Matrix):衡量分數(shù)的遷移狀況

  • PSI 是針對分數(shù)整體進行考察,對應(yīng)的個體可能并不相同
  • 遷移矩陣是對同一個個體進行重復(fù)觀察和比較
  • 對相同的人群寒屯,觀察向量兩次監(jiān)控周期中的分數(shù)遷移變化
  • 實際計算中可以將分數(shù)段十等分荐捻,然后計算著十組間的遷移矩陣

缺點:只能定性判斷,究竟遷移率達到多少寡夹,很難給出模型穩(wěn)定性的判斷標準

3. 檢查逾期違約率的保守性

  • 當(dāng)發(fā)現(xiàn)有分組的逾期違約率低于實際違約率時处面,需要進行二項分布檢驗
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市菩掏,隨后出現(xiàn)的幾起案子魂角,更是在濱河造成了極大的恐慌,老刑警劉巖智绸,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件野揪,死亡現(xiàn)場離奇詭異,居然都是意外死亡瞧栗,警方通過查閱死者的電腦和手機斯稳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來沼溜,“玉大人平挑,你說我怎么就攤上這事∠挡荩” “怎么了通熄?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長找都。 經(jīng)常有香客問我唇辨,道長,這世上最難降的妖魔是什么能耻? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任赏枚,我火速辦了婚禮亡驰,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘饿幅。我一直安慰自己凡辱,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布栗恩。 她就那樣靜靜地躺著透乾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪磕秤。 梳的紋絲不亂的頭發(fā)上乳乌,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天,我揣著相機與錄音市咆,去河邊找鬼汉操。 笑死,一個胖子當(dāng)著我的面吹牛蒙兰,可吹牛的內(nèi)容都是我干的磷瘤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼癞己,長吁一口氣:“原來是場噩夢啊……” “哼膀斋!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起痹雅,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤仰担,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后绩社,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體摔蓝,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年愉耙,在試婚紗的時候發(fā)現(xiàn)自己被綠了贮尉。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡朴沿,死狀恐怖猜谚,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情赌渣,我是刑警寧澤魏铅,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站坚芜,受9級特大地震影響览芳,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鸿竖,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一沧竟、第九天 我趴在偏房一處隱蔽的房頂上張望铸敏。 院中可真熱鬧,春花似錦悟泵、人聲如沸杈笔。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽桩撮。三九已至,卻和暖如春峰弹,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背芜果。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工鞠呈, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人右钾。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓蚁吝,卻偏偏與公主長得像,于是被迫代替她去往敵國和親舀射。 傳聞我的和親對象是個殘疾皇子窘茁,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 一、業(yè)務(wù)學(xué)習(xí) 1 信用體系: 金融市場風(fēng)險包括:市場風(fēng)險脆烟,信用風(fēng)險山林,流動性風(fēng)險,操作風(fēng)險 信用風(fēng)險:交易對手未能履...
    番茄醬的汪閱讀 2,083評論 0 0
  • 數(shù)據(jù)描述:數(shù)據(jù)屬于個人消費類貸款邢羔,只考慮評分卡最終實施時能夠使用到的數(shù)據(jù)應(yīng)從如下一些方面獲取數(shù)據(jù): – 基本屬性:...
    蛐蛐囍閱讀 1,835評論 0 4
  • 申請評分卡對于從事信貸風(fēng)控行業(yè)的人來說肯定不陌生驼抹,甚至每天都會應(yīng)用到。申請評分拜鹤,即對申請客戶打分框冀,對于業(yè)務(wù)專家來說...
    紅栗灰閱讀 6,862評論 7 19
  • 如今在銀行、消費金融公司等各種貸款業(yè)務(wù)機構(gòu)敏簿,普遍使用信用評分明也,對客戶實行打分制,以期對客戶有一個優(yōu)質(zhì)與否的評判惯裕。但...
    sport_QD閱讀 8,261評論 0 37
  • 今天還是蠻不錯的因為收到了佳寶給的禮物温数,不過還是刪了dota吧,這樣我的時間就增加很多了轻猖。 今天看到了一些非常干貨...
    馬寧要日更閱讀 126評論 0 0