1.拒絕推斷的由來
? ? ? ? 在做申請評分卡建模時,使用的標(biāo)簽是是否逾期,而逾期的前提是已經(jīng)審批授信的用戶劈狐。而評分卡的預(yù)測數(shù)據(jù)是授信申請用戶撕瞧,這里就存在“樣本偏差”的問題陵叽。因為訓(xùn)練使用的人群只是預(yù)測人群的一部分,建立的評分卡并沒有考慮授信拒絕的用戶信息丛版。因此在對總體樣本評估時巩掺,會有偏差,有可能會對一些“好人”造成誤傷页畦,若能在建模時胖替,使用拒絕樣本與接收樣本一起建模,就是所說的“拒絕推斷”。2.常用方法
1.實驗法
? ? ? ? 在一段時間內(nèi)接受所有的申請独令,收集數(shù)據(jù)端朵,當(dāng)用戶有了風(fēng)險表現(xiàn)再建模,但需要接受相當(dāng)大的風(fēng)險燃箭,并不實用逸月。
2.直接賦值法
? ? ? ? 通過外部數(shù)據(jù)或人工對拒絕的用戶打上標(biāo)簽,使用外部數(shù)據(jù)或人工審批的成本比較高遍膜。
3.模型擴展法
3.1簡單擴展
(1)在接收樣本上進行建模
(2)用此模型對拒絕樣本打標(biāo)簽碗硬。設(shè)置一個閾值,高于閾值的為壞樣本瓢颅,反之為好樣本恩尾。閾值的選擇一般要使拒絕樣本的壞賬率是接受樣本壞賬率的兩倍
(3)將有標(biāo)簽的拒絕樣本與接受樣本混合進行建模
(4)重復(fù)2,3,步直至模型參數(shù)收斂,一般迭代2至3次即可
3.2 分段擴展
? ? ? ? 上述所說的簡單擴展挽懦,將拒絕樣本按照某個閾值采用一刀切的方式分成好樣本和壞樣本翰意,這樣的切分使拒絕樣本的違約分布和接受樣本差別極大,而分段擴展正好修正這一缺點信柿。步驟如下:
(1)在接受并已知好壞的樣本上建模冀偶。
接下來渔嚷,按照各分?jǐn)?shù)段對拒絕樣本打標(biāo)簽进鸠。一般拒絕樣本的違約率高于接受樣本,這里假設(shè)拒絕樣本的違約率是同分?jǐn)?shù)段接受樣本的2倍形病。以0-350分?jǐn)?shù)段為例客年,接受樣本的違約率為26.7%,設(shè)置拒絕樣本的違約率為53.4%漠吻,然后根據(jù)這個違約率量瓜,隨機的將該分?jǐn)?shù)段內(nèi)的樣本設(shè)置成好和壞,或者根據(jù)分?jǐn)?shù)高低途乃,高分?jǐn)?shù)設(shè)置為好绍傲,低分?jǐn)?shù)設(shè)置為壞,就像簡單擴展法中的做法耍共。下圖為打好標(biāo)簽的拒絕樣本的違約分布:
(3)將(2)中打好標(biāo)簽的拒絕樣本和接受樣本放在一起建模烫饼。
(4)重復(fù)(2)和(3)直至模型參數(shù)收斂。
參考鏈接:
(如有不同見解划提,望不吝指教7愕堋)