本文簡要給些做信貸風控模型的思路催什,當然最理想的個人風控模型:央行征信報告+市場響應模型+申請評分模型+行為模型+催收評分模型+收益模型?反欺詐模型的組合體【當然設計風控模型一定要匹配相應的金融產(chǎn)品和場景,劃分好目標受眾后室,否則都是在扯淡】粟关。而對于企業(yè)的風控模型鼻疮,從業(yè)務模式上只要是能以供應鏈金融為場景依托忌愚,能夠對核心企業(yè)有相應的穿透型數(shù)據(jù)的支撐筛婉,風控建模也會水到渠成藻懒。說到供應鏈要注重:從供應企業(yè)-研發(fā)企業(yè)-生產(chǎn)制造企業(yè)-經(jīng)銷企業(yè)-終端客戶的整體鏈條剔猿,考慮業(yè)務流、資金流嬉荆、物流归敬、增值流的全部環(huán)節(jié)才能做好供應鏈金融的產(chǎn)業(yè)核心風控。
本文討論的風控模型的建立,主要針對的還是信用類融資申請的方向汪茧,對于以有擔保方椅亚、質(抵)押品、信用保障保險或其他實物或股票等抵押作為第二還款來源的模式不在范圍內舱污。
【另外不要小看貸款目的用途這一項呀舔,針對不同人群,不同企業(yè)扩灯,這是重要的風險識別標準之一媚赖,雖然沒有明確的量化指標,但是讓客戶產(chǎn)生貸款意愿的真實目的是影響還款意愿的重要成分驴剔。筆者曾經(jīng)對3000名實際貸款人的數(shù)據(jù)進行過跟蹤測試省古,其中用作真實消費用途的用戶的實際違約率近2.25%,而用來償還信用卡的用戶的實際違約率竟然高達9.05%】
實際分析過程中丧失,考量因素(以電商為核心的中小企業(yè)為例)
貸前:【信用品質】營銷指引豺妓、準入規(guī)則、渠道控制布讹、外部數(shù)據(jù)檢查琳拭、申請資格審查、平臺交易數(shù)據(jù)描验;
貸中:【信用品質】身份核實白嘁、婚姻狀況、邏輯檢查膘流、評分卡及策略絮缅、征信、黑名單反欺詐呼股、過往貸款歷史記錄
貸后:【信用品質】身份變化/司法刑事責任/信用品質惡化/企業(yè)主及主要股東聲譽/個人風險信用預警/客戶交易信用水平/欺詐交易/平臺懲罰信息
貸前:【還款能力】收入狀況耕魄、貨物周轉率、盈利狀況彭谁、行業(yè)標準對比
貸中:【還款能力】平臺收入合適吸奴、平臺交易歷史比對、最低收入缠局、貸款期限金額利率
貸后:【還款能力】店鋪經(jīng)營下降情況则奥、交易量下降情況、客戶履約變化程度狭园、逾期狀況读处、
貸前:【押品】經(jīng)營時間準入、客戶違約成本核算唱矛、抵押品管理及準入
貸中:【押品】最大/小抵押品評估價值
貸后:【押品】店鋪所有權/經(jīng)營權變更情況档泽、與店鋪相關的重大事件俊戳、抵押品變更/清償障礙
貸前:【資產(chǎn)財務狀況】資產(chǎn)情況調查、負責情況調查馆匿、杠桿率、當前居住情況燥滑、當前職業(yè)及穩(wěn)定性渐北、收入情況
貸中:【資產(chǎn)財務狀況】資產(chǎn)負債表/利率、現(xiàn)金流量表铭拧、業(yè)務或主要股東報告期存借款赃蛛、線上線下交易流水
貸后:【資產(chǎn)財務狀況】店鋪交易變動、線上交易異動(防刷單)
貸前:【經(jīng)營狀況】具體貸款用途搀菩、企業(yè)償債能力呕臂、貸款背調、設備運轉率或開工率肪跋、核心技術水平歧蒋、前置審批條件
貸中:【經(jīng)營狀況】成品倉庫的出入庫、供應商/銷售商情況州既、預計資金來源及使用情況谜洽、項目建設進度及生產(chǎn)運營計劃
貸后:【經(jīng)營狀況】回訪異常跟蹤、管理層關鍵技術人員變化吴叶、關鍵的限制性條款變化阐虚、行業(yè)變化及政策性影響
當然在建模前,必要做的就是數(shù)據(jù)的整理及清洗(在實際我們進入到銀行的項目中蚌卤,發(fā)現(xiàn)數(shù)據(jù)處理占了整體建模的40%的時間实束,分析實際的占比大概在10%,試算及模型占了40%)逊彭,同時針對不同的業(yè)務模式及資產(chǎn)特性咸灿,要完成必要的分析,主要的分析方法:統(tǒng)計學(均值诫龙、占比析显、方差、分位數(shù))签赃,基于統(tǒng)計假設的校驗谷异、聚類算法和判別分析、回歸分析锦聊、模擬分析和預測分析歹嘹,這些方法看似理論但是在發(fā)現(xiàn)數(shù)據(jù)關系及做入場的前期準備過程非常之重要的方法。比如在針對某款企業(yè)借款過程中對企業(yè)市場推廣及營銷費用使用情況與企業(yè)自身的經(jīng)營狀況的匹配度的判別孔庭,在現(xiàn)實生活中尺上,很少能找到一個純粹正態(tài)分布的場景材蛛,這就需要我們的風控分析人員借助F檢驗、T檢驗去辨別差異的指標怎抛,再利用均值卑吭、方差、偏度马绝、峰度來綜合考慮豆赏,切記即便選擇的維度是線性輸入的正態(tài)分布,最終分析結果不一定就遵循正太分布富稻。這時候各種分類方法就派上了用場掷邦,因為除了數(shù)據(jù)源質量及來源這個主要外部因素外,建模過程中椭赋,分類方法與數(shù)據(jù)源交叉的狀況抚岗、變量數(shù)量、殘差被認為是對模型解釋起到?jīng)Q定性的主要因素哪怔。在我們的實際工作中(主要針對互聯(lián)網(wǎng)為依托的信用貸款場景及以電商為依托的小微或個體工商戶借款)宣蔚,最終我們的違約率預測模型中的變量在18個左右,太多或太少都有可能產(chǎn)生過擬合蔓涧。雖然可以用ROC和KS值來幫助監(jiān)測分析過程中的模型使用情況件已,但是實際上差別比我們想象中的要小(比如針對信貸業(yè)務同樣的邏輯過程元暴,使用LR篷扩,DT,SVM茉盏,樸素貝葉斯四種方法)鉴未。另外,不是說經(jīng)驗主義都不好鸠姨,在模型試算時或前期分析的過程中铜秆,相信一些有經(jīng)驗的信貸老兵的意見,能夠減少很多計算資源的消耗讶迁,切莫大量嘗試不同的算法對同樣的數(shù)據(jù)集的反復嘗試连茧,筆者曾經(jīng)浪費大量時間在算法及統(tǒng)計學分析方法上,很多決策(在變量篩選時巍糯,在特征工程過程中)是要符合社會發(fā)展和人性的一般規(guī)律的啸驯。(下面是個反欺詐建模過程的例子)
整體的過程流程如下:
到底信用風控過程中得有多少模型才算夠,比如:反欺詐祟峦、風險定價罚斗、信用評分、增信宅楞、行為評分针姿、風險預警袱吆、賬齡滾動、催收距淫、失聯(lián)模型等構成绞绒,有這些基本就夠了,如果再細粒度去進行分那么每一個都可以拆成決策分析評分和模型評分兩個部分榕暇。實操過程一定讓金融產(chǎn)品的同事參與建模的過程处铛,哪怕只是知曉,因為哪怕是產(chǎn)品中還款方式的變化對模型的結果影響都是很大的拐揭。
最后簡要展示一下我們的系統(tǒng)架構
這張圖盡量給的模糊點,但是基本可以看出一個真實的信貸風控系統(tǒng)中奕塑,建模也只是其中的一個部分堂污,整體的工作流程必須可配置且易輸出,比如打包成PMML文件給金融機構內部的平臺進行結合等龄砰,工作流的過程中盟猖,保證決策流程的可分解,有些可以全自動化完成换棚,有些可以自動?人工審核完成式镐。