信用評分卡模型開發(fā)流程

本文是基于書籍《信用風(fēng)險(xiǎn)評分卡研究》學(xué)習(xí)總結(jié)徘熔,此篇為提綱车猬,后續(xù)會針對每一部分詳細(xì)介紹

標(biāo)準(zhǔn)評分卡

  • 申請?jiān)u分卡(A卡)

側(cè)重貸前霉猛,在客戶獲取期,建立信用風(fēng)險(xiǎn)評分珠闰,預(yù)測客戶帶來違約風(fēng)險(xiǎn)的概率大小惜浅。

  • 行為評分卡(B卡)

側(cè)重貸中,在客戶申請?zhí)幚砥谥酰⑸暾堬L(fēng)險(xiǎn)評分模型赡矢,預(yù)測客戶開戶后一定時(shí)期內(nèi)違約拖欠的風(fēng)險(xiǎn)概率。

  • 催收評分卡(C卡)

側(cè)重貸后阅仔,在帳戶管理期吹散,建立催收評分模型,對逾期帳戶預(yù)測催收策略反應(yīng)的概率八酒。

1.問題準(zhǔn)備

明確業(yè)務(wù)要解決的問題空民,確定模型的評價(jià)指標(biāo)和數(shù)據(jù)來源

2.數(shù)據(jù)獲取和整合

將雜亂的數(shù)據(jù)處理為模型所需格式

  • 變量類型

原始變量,衍生業(yè)務(wù)指標(biāo)(有業(yè)務(wù)含義)羞迷,分析變量(缺少明確的含義界轩、但預(yù)測能力高)

  • 建模視圖
  • 具體包括:ID標(biāo)識,候選自變量衔瓮,描述變量浊猾,報(bào)告變量,違約狀態(tài)字段热鞍。
  • 從分析角度包括:名義變量(分類變量)葫慎,順序變量(有序分類變量)衔彻,連續(xù)變量。

此部分是建模所需數(shù)據(jù)匯總偷办,但可能只有一部分?jǐn)?shù)據(jù)會最終使用艰额。

  • 數(shù)據(jù)來源

人口統(tǒng)計(jì)學(xué)特征、征信機(jī)構(gòu)數(shù)據(jù)和外部數(shù)據(jù)椒涯、交易記錄等柄沮,實(shí)際需根據(jù)業(yè)務(wù)確定

  • 數(shù)據(jù)校準(zhǔn)、合并废岂、整合祖搓、檢驗(yàn)

對數(shù)據(jù)的業(yè)務(wù)真實(shí)性作校驗(yàn),對不同來源數(shù)據(jù)作整合泪喊,并檢驗(yàn)數(shù)據(jù)的完整性

3.EDA(探索性數(shù)據(jù)分析)

  • 描述性統(tǒng)計(jì)(單變量統(tǒng)計(jì):均值棕硫、方差、眾數(shù)袒啼、四分位數(shù)等)
  • 評估變量值的分布和檢驗(yàn)正態(tài)假設(shè)
  • 極端值的識別和處理
  • 缺失值的計(jì)算和處理
  • 關(guān)鍵變量列聯(lián)表統(tǒng)計(jì)量計(jì)算(卡方統(tǒng)計(jì)量)
  • 變量間相關(guān)性和關(guān)聯(lián)性指標(biāo)計(jì)算(皮爾遜相關(guān)系數(shù)哈扮、斯皮爾曼相關(guān)系數(shù)、基尼方差等)

通過以上的數(shù)據(jù)分析篩選出一部分可以入模型的變量蚓再。

4.數(shù)據(jù)準(zhǔn)備

這部分是評分卡模型一些特有的處理方法滑肉,目的是為了增加變量的預(yù)測能力。

  • 降低基數(shù)摘仅,對于類別數(shù)較多的名義變量靶庙,合并部分類別。
  • 將連續(xù)變量分段(最優(yōu)分段:決策樹算法)娃属,進(jìn)行證據(jù)權(quán)重轉(zhuǎn)換(woe)
  • 抽樣和權(quán)重轉(zhuǎn)換(隨機(jī)抽樣六荒、均衡抽樣、分層抽樣)

5.建模和變量選擇方法

  • 模型算法:Logistic算法
  • 變量選擇:正向選擇矾端,逆向選擇掏击,逐步選擇,最優(yōu)得分統(tǒng)計(jì)模型秩铆。

評分卡模型需要可解釋砚亭,所以目前業(yè)內(nèi)大部分采用Logistic算法,后續(xù)會詳細(xì)介紹殴玛。

6.模型評估

  • 要求:精準(zhǔn)性捅膘,穩(wěn)健性,有意義
  • 評估方法:混淆矩陣滚粟,洛倫茲曲線寻仗,K-S曲線,ROC曲線凡壤。

通過這些方法判斷模型好壞愧沟,最后再整體考慮選擇最優(yōu)變量和模型蔬咬,這是一個(gè)平衡的過程。

7.評分卡實(shí)施和報(bào)告

在模型調(diào)優(yōu)完成后就需要在業(yè)務(wù)中應(yīng)用沐寺,對每一位客戶評分,并設(shè)置評分的臨界水平盖奈,通過評分判斷是否放貸混坞,貸款金額、貸款利率等钢坦。

根據(jù)評分卡在實(shí)際業(yè)務(wù)中的表現(xiàn)究孕,制作實(shí)施前報(bào)告和實(shí)施后報(bào)告,并根據(jù)客戶群體和市場的變化評估模型的穩(wěn)定性爹凹,不定期調(diào)整模型厨诸。

8.拒絕演繹

目前申請?jiān)u分卡所研究的數(shù)據(jù)并不是從申請總體中隨機(jī)選擇的,而只是從過去已經(jīng)通過審批的賬戶中選擇的禾酱,因此將模型用于所有的群體隱含著對被拒絕用戶的忽視微酬,所以,在建立評分卡時(shí)將被拒絕這部分用戶進(jìn)行演繹加入到模型數(shù)據(jù)集中颤陶,這種方法被稱為拒絕演繹颗管。

在信用評分領(lǐng)域,并不是所有人都認(rèn)同拒絕演繹的價(jià)值和有效性滓走,這仍是一個(gè)有爭議的話題垦江,所以本文并不把這部分作為重點(diǎn)介紹。

以上是信用評分卡的整體流程簡介搅方,書中主要使用sas完成開發(fā)比吭,在后續(xù)對每一部分做詳細(xì)拆解中會側(cè)重使用python。

人生苦短姨涡,我用python衩藤。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市绣溜,隨后出現(xiàn)的幾起案子慷彤,更是在濱河造成了極大的恐慌,老刑警劉巖怖喻,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件底哗,死亡現(xiàn)場離奇詭異,居然都是意外死亡锚沸,警方通過查閱死者的電腦和手機(jī)跋选,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哗蜈,“玉大人前标,你說我怎么就攤上這事坠韩。” “怎么了炼列?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵只搁,是天一觀的道長。 經(jīng)常有香客問我俭尖,道長氢惋,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任稽犁,我火速辦了婚禮焰望,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘已亥。我一直安慰自己熊赖,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布虑椎。 她就那樣靜靜地躺著震鹉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪绣檬。 梳的紋絲不亂的頭發(fā)上足陨,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機(jī)與錄音娇未,去河邊找鬼墨缘。 笑死,一個(gè)胖子當(dāng)著我的面吹牛零抬,可吹牛的內(nèi)容都是我干的镊讼。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼平夜,長吁一口氣:“原來是場噩夢啊……” “哼蝶棋!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起忽妒,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤玩裙,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后段直,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吃溅,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年鸯檬,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了决侈。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡喧务,死狀恐怖赖歌,靈堂內(nèi)的尸體忽然破棺而出枉圃,到底是詐尸還是另有隱情,我是刑警寧澤庐冯,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布孽亲,位于F島的核電站,受9級特大地震影響展父,放射性物質(zhì)發(fā)生泄漏墨林。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一犯祠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧酌呆,春花似錦衡载、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至菩收,卻和暖如春梨睁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背娜饵。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工坡贺, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人箱舞。 一個(gè)月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓遍坟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親晴股。 傳聞我的和親對象是個(gè)殘疾皇子愿伴,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 如今在銀行、消費(fèi)金融公司等各種貸款業(yè)務(wù)機(jī)構(gòu)电湘,普遍使用信用評分隔节,對客戶實(shí)行打分制,以期對客戶有一個(gè)優(yōu)質(zhì)與否的評判寂呛。但...
    sport_QD閱讀 8,263評論 0 37
  • 信用風(fēng)險(xiǎn)計(jì)量體系包括主體評級模型和債項(xiàng)評級兩部分怎诫。主體評級和債項(xiàng)評級均有一系列評級模型組成,其中主體評級模型可用“...
    YoLean閱讀 101,637評論 34 153
  • 信用評分卡主要有三種(A卡昧谊、B卡刽虹、C卡): A卡:申請?jiān)u分卡,側(cè)重貸前呢诬,在客戶獲取期涌哲,建立信用風(fēng)險(xiǎn)評分胖缤,預(yù)測客戶帶...
    JSong1122閱讀 6,005評論 0 9
  • 七絕·詩心(新韻) 作者/胡德棒 千里詩集寄友情,品山悟水道禪經(jīng)阀圾; 何時(shí)敢效先賢志哪廓,回贈恩師敬點(diǎn)評!
    補(bǔ)缺樓丨胡德棒閱讀 274評論 0 2