數(shù)據(jù)風(fēng)控那點事
數(shù)據(jù)風(fēng)控那點事
活動筆記·大數(shù)據(jù)
本文優(yōu)質(zhì)度:★★★★★ 口感:內(nèi)蒙古牛肉
筆記俠說:
一、數(shù)據(jù)風(fēng)控
是一個什么樣的行業(yè)湾宙?
數(shù)據(jù)是大數(shù)據(jù)風(fēng)控的核心妒御,數(shù)據(jù)的量級要大解愤,數(shù)據(jù)的維度要多、數(shù)據(jù)的迭代速度要快乎莉,立體多維迭代快才能體現(xiàn)數(shù)據(jù)的真正價值送讲。
而風(fēng)控是對市場、信用及實操層面的風(fēng)險控制惋啃。
大數(shù)據(jù)風(fēng)控的直觀感受哼鬓,它是能將相似的人更精準地分群,既能讓你看到形形色色的人边灭,又能讓你從豐富的單一數(shù)據(jù)中看到萬千的世界异希。
做數(shù)據(jù)做模型要了解人和業(yè)務(wù)場景才能夠更準確的進行實踐應(yīng)用。
1.數(shù)據(jù)風(fēng)控的目的是什么绒瘦?
當(dāng)我們想去銀行辦一筆貸款時称簿,從客戶的角度扣癣,大概流程是這樣的。
數(shù)據(jù)風(fēng)控那點事
當(dāng)我們換個角度予跌,從銀行的角度搏色,流程又是這樣的。
數(shù)據(jù)風(fēng)控那點事
從上面兩張圖看起來券册,其中有一個重要環(huán)節(jié)频轿,即在貸款申請人提交了申請資料后,銀行需要對貸款人的申請資料進行審核烁焙。
畢竟銀行要給你錢航邢,銀行總要知道你的還款能力,而不是說拿了錢就跑骄蝇。
怎么審核膳殷?
只有一個辦法,用機器(主要是電腦)來提高勞動生產(chǎn)率九火,把成本降低到能讓企業(yè)賺錢的程度赚窃。
但用電腦代替人有一個很重要的前提是,用數(shù)字去描述人的各種行為岔激,并且要把這些描述邏輯寫成電腦程序勒极,以便電腦可執(zhí)行。
簡單來講虑鼎,用電腦代替人來進行貸款審核辱匿,需要如下四類職位共同來協(xié)作完成(畢竟他們需要的專業(yè)知識還是有相當(dāng)差距的),而且實際情況非常復(fù)雜炫彩。
業(yè)務(wù)人員:主要確定金融產(chǎn)品的相關(guān)細節(jié)匾七,他們了解客戶的需求和金融相關(guān)的知識,同時江兢,他們也是所有需求的發(fā)起者昨忆。
數(shù)據(jù)分析師:這類職位的主要作用是把業(yè)務(wù)需求轉(zhuǎn)化為數(shù)學(xué)邏輯。
IT研發(fā):這類職位則把數(shù)據(jù)分析師所得到的數(shù)學(xué)邏輯寫成計算機程序和代碼划址。
IT運維:這類職位的主要作用是保證電腦的正常運行扔嵌,不要死機。
當(dāng)然夺颤,實際情況是職位之間會相互交叉。
同時也會有更多的職位胁勺,大數(shù)據(jù)風(fēng)控我認為就是數(shù)據(jù)分析師和業(yè)務(wù)人員的結(jié)合體世澜,把人對風(fēng)險的判斷轉(zhuǎn)換成電腦可以識別的數(shù)學(xué)邏輯;
通過數(shù)據(jù)的分析進一步提供挖掘出更多有利于我們對客戶風(fēng)險的判斷署穗。
2. 做好數(shù)據(jù)風(fēng)控需要掌握什么技能寥裂?
一名合格的數(shù)據(jù)風(fēng)控嵌洼,不僅需要掌握很多技能,還要有各種相關(guān)的實操經(jīng)驗封恰。
有些技能是硬功夫麻养,也就是那種通過短期的突擊培訓(xùn)就能相對熟練掌握的技能;
有些技能是看的見诺舔,摸不著的鳖昌,需要時間和項目去不斷積累才能掌握的技能。
① 代碼能力
代碼能力是作為一個數(shù)據(jù)風(fēng)控的基礎(chǔ)中的基礎(chǔ)低飒,如果一個入門的員工連這項能力都沒有许昨,而其他能力又不夠吸引人,那么褥赊,在絕大多數(shù)急功近利的企業(yè)中糕档,根本不會有任何機會。
一名數(shù)據(jù)風(fēng)控需要掌握的技能拌喉,基礎(chǔ)是SQL速那,R,Python尿背,SAS中的任意一樣端仰,不過,其中的SAS目前在國內(nèi)用的人越來越少残家。
如果能同時掌握2~3項技能榆俺,還有一個精通,那就很棒了坞淮。
② 數(shù)學(xué)基礎(chǔ)
這里的數(shù)學(xué)基礎(chǔ)主要是概率論和數(shù)理統(tǒng)計中的主要內(nèi)容茴晋,包括均值、方差回窘、假設(shè)檢驗诺擅、回歸分析等內(nèi)容。
另外啡直,為了跟上目前機器學(xué)習(xí)這個熱點烁涌,最好學(xué)習(xí)一些相關(guān)的決策樹算法、離散數(shù)學(xué)酒觅、運籌學(xué)撮执、最優(yōu)化等方面的內(nèi)容。
③ 數(shù)學(xué)建模能力
這個既可簡單舷丹,也可復(fù)雜抒钱。
往簡單來說,就是按照行業(yè)已有的套路把模型做出來,雖然很多地方不知道為什么谋币,但只要按照規(guī)矩走仗扬,跟著做幾個項目,就出不了大問題蕾额。
往復(fù)雜去說早芭,其實,數(shù)據(jù)風(fēng)控就是將業(yè)務(wù)問題轉(zhuǎn)換為一個個數(shù)學(xué)的問題诅蝶,去求解和分析退个。
雖說行業(yè)中常碰到的問題也就十幾種,但能在不同機構(gòu)把這些事情實打?qū)嵉淖鲆槐槌由矣凶约旱乃伎己桶l(fā)揮帜乞,這種機會不會天天有的。
④ 銀行業(yè)的基礎(chǔ)知識
同樣筐眷,如果簡單的話黎烈,只要搞清楚你們家的房貸利息是怎么算出來的,在各種情況下匀谣,違約金怎么算照棋,每個月的還款金額是怎么算出來的,到底有幾種還款方式武翎;
往復(fù)雜里說烈炭,目前主流的個人信貸產(chǎn)品特征、費用構(gòu)成宝恶、主要客群等信息符隙。
像《貨幣銀行學(xué)》、《宏觀經(jīng)濟學(xué)》垫毙、《微觀經(jīng)濟學(xué)》以及近年來特別流行的相關(guān)書籍霹疫,包括我們國家跟銀行業(yè)、征信業(yè)相關(guān)的監(jiān)管機構(gòu)综芥、職能及法律法規(guī)丽蝎,跟風(fēng)控相關(guān)的上下游產(chǎn)業(yè)以及比較主流的黑產(chǎn)等都需要有所了解。
⑤ 數(shù)據(jù)知識
數(shù)據(jù)是數(shù)據(jù)風(fēng)控的原材料膀藐,沒有這些原材料一切都無從談起屠阻。
那么,我們國家目前針對不同等級的個人信貸產(chǎn)品额各,能夠在業(yè)務(wù)流程中獲取到的數(shù)據(jù)有哪些国觉?每種數(shù)據(jù)不同來源有哪些?都有哪些數(shù)據(jù)供應(yīng)商蛉加?
數(shù)據(jù)的主要獲取方式缸逃、當(dāng)前的主流價格针饥、每種數(shù)據(jù)在使用中涉及到的優(yōu)點和問題等丁眼。
⑥ 行業(yè)和業(yè)務(wù)經(jīng)驗
很多事情就像一層窗戶紙一樣昭殉,原理很簡單,但別人不跟你說就很難明白挪丢。
這些經(jīng)驗包括在不同場景下常用的風(fēng)險策略、在突發(fā)情況發(fā)生時常用的應(yīng)對方法惠啄、風(fēng)險策略的決策機制、如何與IT部門溝通風(fēng)控需求以及怎么寫各種文檔等撵渡。
這個行業(yè)和其他行業(yè)一樣,都是從別人告訴你怎么做死嗦,到自己明白怎么做趋距,再到告訴別人怎么做這一個曲折上升的過程。
但唯一不變的就是變化越除,尤其是我們這個行業(yè)的相關(guān)知識的迭代速度可能相對于其他行業(yè)更快节腐,逆水行舟,不進則退摘盆。
二翼雀、如何從零構(gòu)建信貸業(yè)務(wù)的
大數(shù)據(jù)風(fēng)控能力?
其實骡澈,從零構(gòu)建信貸業(yè)務(wù)的大數(shù)據(jù)風(fēng)控能力有點浮夸锅纺,也沒這個水準真正的從0做起,我們都是站在了巨人的肩膀上肋殴。
很多人應(yīng)該都沒有經(jīng)過一項信貸業(yè)務(wù)真正從零做起囤锉,不過,你經(jīng)歷過后护锤,一般都會有“人生大起大落官地,實在是太刺激了”的感覺。
建立一個名副其實的具有大數(shù)據(jù)風(fēng)控能力的金融科技企業(yè)烙懦,一般會經(jīng)歷這幾個階段:一窮二白驱入、盲人摸象、小有積累、日積月累亏较。
1.一窮二白:拍腦袋
在產(chǎn)品上線前莺褒,一般來講,沒有任何數(shù)據(jù)可以分析雪情,唯一能借鑒的就是我們在之前的工作中積攢的經(jīng)驗遵岩。
產(chǎn)品形態(tài):
是最先確定下來的,因為這是后面所有一切的基礎(chǔ)巡通。
這里的產(chǎn)品形態(tài)包括額度范圍尘执、還款方式和綜合息費水平宴凉;
關(guān)于產(chǎn)品弥锄,還有一個非常重要的方面則是還款方式和還款提醒這一點經(jīng)常被人們忽略窘行。
其中現(xiàn)金貸這個市場與傳統(tǒng)金融熟知的面向優(yōu)質(zhì)人群的信貸市場有一個最大的差別在于:借款人的素質(zhì)罐盔。
這個人群有幾個特點需要引起注意:
① 一個人通常一個月有很多個還款節(jié)點惶看;
② 不是特別在乎征信纬黎,而且平臺主動報送的積極性和通道都有問題;
③ 自控能力差冠息,一般都是有錢就花的主逛艰。
風(fēng)險策略和數(shù)據(jù)供應(yīng)商:
它們會相互影響散怖,而且是直接取決于我們的產(chǎn)品形態(tài)镇眷,因為你要參考市場競品的產(chǎn)品流程丹诀,不能為了控制風(fēng)險而影響了用戶的體驗;
同時沿猜,對于有些數(shù)據(jù)啼肩,如果沒有成熟的供應(yīng)商祈坠,那么赦拘,在開發(fā)力量有限的情況下,也很可能無法完成采集蹋艺,而能夠獲取到的數(shù)據(jù)又會直接影響到我們在不確定風(fēng)險政策時潛在的可能性捎谨。
根據(jù)產(chǎn)品邏輯涛救、目標客群以及能夠?qū)拥降臄?shù)據(jù)源州叠,拍拍腦袋逆甜,把風(fēng)險策略定下來交煞,就可以進行下面的步驟了素征。
需要注意的是御毅,這個階段端蛆,模型大概有如下幾種情況:
① 這里的模型就是代指拍腦袋的規(guī)則酥泛;
② 這個模型是從別處“借鑒”來的呆躲;
③ 從外部采購了一部分捶索。
在確定了基本的風(fēng)險策略和數(shù)據(jù)供應(yīng)商后燥筷,進行接口的對接也有不小的工作量肆氓,尤其是大名鼎鼎的運營商強授權(quán)數(shù)據(jù)谢揪。
決策引擎:
決策引擎應(yīng)該很多人聽過拨扶,不過出于種種原因患民,它被復(fù)雜和神秘化了匹颤。
其實印蓖,決策引擎最核心的功能是在用戶發(fā)起申請后溅蛉,能夠從眾多數(shù)據(jù)源或內(nèi)部數(shù)據(jù)庫中將決策所需要的數(shù)據(jù)調(diào)用過來船侧。
將數(shù)據(jù)進行處理后勺爱,根據(jù)預(yù)先設(shè)定好的風(fēng)險規(guī)則進行判斷,并可以輸出決策結(jié)果(是否授信人灼、額度投放、利率等),主流的決策引擎軟件烙样,包括FICO的BLAZE谒获,Experian的 SMG3等批狱。
決策引擎在開發(fā)中的難點主要是兼容性赔硫,規(guī)則的靈活配置权悟,輔助BI(商業(yè)智能)和熱拔插僵芹。
但在業(yè)務(wù)的這個階段小槐,這些功能的優(yōu)先級都不是那么高凿跳,因此茧彤,程序員的hard code(指的是在軟體實作上,把輸出或輸入的相關(guān)參數(shù) 「例如:路徑曾掂、輸出的形式、格式」直接寫死在原始碼中)是性價比最高的實現(xiàn)方式许蓖。
這一階段團隊需要具備的能力:
① 能有一個比較靠譜的風(fēng)險規(guī)則膊爪,這個一定需要至少在個人零售信貸領(lǐng)域制定過風(fēng)險策略的經(jīng)驗;
② 能夠針對產(chǎn)品特點淮逻,梳理產(chǎn)品可能存在的風(fēng)險點爬早,經(jīng)驗要求同上;
③ 能夠?qū)L(fēng)險規(guī)則和產(chǎn)品需求轉(zhuǎn)化為IT需求桨啃,這個經(jīng)驗要求至少是能夠做簡單的數(shù)據(jù)分析照瘾,能寫一些簡單的代碼的產(chǎn)品經(jīng)理析命。
④ 能夠?qū)⑸鲜鲂枨笤诤笈_實現(xiàn)簇搅,并且能夠保證系統(tǒng)的穩(wěn)定運行的研發(fā)能力软吐,這個主要要求有相當(dāng)時間的后臺開發(fā)經(jīng)驗瘩将,最好是信貸行業(yè)。
⑤ 最好對目前市場上成熟的數(shù)據(jù)供應(yīng)商有相當(dāng)?shù)牧私獍及遥ǚ?wù)形式姿现,大概市場價格等等。
2.盲人摸象:碰運氣
這個階段通常是在產(chǎn)品上線及前三個還款周期結(jié)束前肖抱,之所以稱其為盲人摸象建钥,是因為這個階段,只有申請數(shù)據(jù)虐沥,而沒有足夠的還款表現(xiàn)泽艘,就像盲人摸象一樣然低,只能摸到片面吨灭,而不是整體。
在這個階段郭变,我們的大數(shù)據(jù)風(fēng)控團隊除了檢測這個規(guī)則體系的平穩(wěn)運行以外横辆,還必須做如下幾個事:
① 開發(fā)一個定時將業(yè)務(wù)數(shù)據(jù)脫敏,并導(dǎo)出到一個獨立數(shù)據(jù)庫的功能;
② 確定風(fēng)險監(jiān)控的基本框架和觀測特征集命咐,建立一個簡單的風(fēng)險BI平臺沛善;
③ 通過對申請數(shù)據(jù)的分析胀葱,錨定實際客群的特征搂抒;
做這幾件事情的目的只有一個,即能夠在最短的時間捕捉到客群的風(fēng)險趨勢垮媒,做出最快的響應(yīng)。
這個階段團隊需要具有的能力除了第一階段的幾個外士袄,還需要幾個新技能,包括:
① 使用SQL或python或R或SAS從數(shù)據(jù)庫蕉朵、文本文件中提取想要的數(shù)據(jù)進行分析的能力隆夯,此處的要求至少有類似的數(shù)據(jù)分析經(jīng)驗,當(dāng)然溯捆,代碼能力超強的除外;
② 知道此類數(shù)據(jù)庫的設(shè)計倘要,因為做分析的數(shù)據(jù)庫結(jié)構(gòu),跟做業(yè)務(wù)用的數(shù)據(jù)庫結(jié)構(gòu)是不太一樣的仔涩,所以,經(jīng)驗要求至少是在一個成熟的企業(yè)做類似的事情霞揉。
③ 知道如何設(shè)計常規(guī)的風(fēng)險監(jiān)控報表,這個一般也是要求至少在個人零售信貸領(lǐng)域制定過風(fēng)險策略的經(jīng)驗;
④ 知道如何設(shè)計海量指標的監(jiān)測的報表和將風(fēng)險監(jiān)控數(shù)據(jù)轉(zhuǎn)化為分析需求的能力彪见,這個要求相對較高柴钻,大概就是把上面三個技能的要求加在一起;
⑤ 出色的文檔和日志能力上沐,前期策略變化可能會比較頻繁皮服,如果不把變化一一記錄下來,后面出現(xiàn)問題將無處可查参咙。
3.小有積累 :打補丁
經(jīng)歷了前期的大起大落龄广,這時已經(jīng)積累了“具有統(tǒng)計意義的”數(shù)據(jù)了,這個階段的主要任務(wù)如下:
① 不斷做案例分析蕴侧,積累經(jīng)驗择同。
做案例分析時,很多人看到所謂的“壞”樣本净宵,某種行為發(fā)生的頻率很高敲才,就斷定一個很好的指標裹纳。
但其實這才是案例分析的第一步,當(dāng)發(fā)現(xiàn)一個符合“好指標”定義指標后紧武,一定要把它放在你的好客戶里剃氧,看看是不是也是這樣,如果是阻星,那就說明也許只是客群特征而不是“壞客戶”特征朋鞍。
如果不是,那么恭喜妥箕,確實“可能”找到了一個很好的指標滥酥。
② 嘗試做模型。
在這種情況下矾踱,由于在中前期的數(shù)據(jù)量的問題恨狈,不是特別推薦使用機器學(xué)習(xí)算法進行建模,尤其是使用默認參數(shù)的機器學(xué)習(xí)模型呛讲,更推薦使用相對傳統(tǒng)的評分卡模型或邏輯回歸模型禾怠,畢竟這些模型是小透明,風(fēng)險相對可控贝搁。
③ 建立一套模型監(jiān)控和迭代的系統(tǒng)吗氏。
由于數(shù)據(jù)量小,模型的穩(wěn)定性非常容易受到客群變化的影響雷逆,一套行之有效的模型監(jiān)控和迭代流程是很有必要的弦讽。
由于模型不是那種“一出場就穩(wěn)了”的科技,因此膀哲,把指標監(jiān)控和案例分析及配套的策略管理做好往产,是非常重要的。
4.日積月累:筑城墻
通過不斷的業(yè)務(wù)積累某宪,對于企業(yè)來講已經(jīng)獲得了下面幾樣非常寶貴的東西仿村,尤其是第一個:
三、如何“謹慎的”進行數(shù)據(jù)評估兴喂?
不管是引入一個外部評分還是企業(yè)內(nèi)部研發(fā)了一個新的內(nèi)部評分蔼囊,基于這個新評分制定相應(yīng)的策略、再到新策略的上線是一個非常漫長衣迷、復(fù)雜和涉及多部門協(xié)作的過程畏鼓。
但作為一個一線的模型人員或者數(shù)據(jù)測試人員來說,后面這個過程的變數(shù)很大壶谒,時間和人力成本很高云矫,不可能每評估一個模型都把全流程走一遍;
另一個方面汗菜,如前面強調(diào)的让禀,那些數(shù)學(xué)指標更多的是參考價值贵少,畢竟數(shù)學(xué)和業(yè)務(wù)中間還是有一段距離。
那么堆缘,是否有什么簡易的方法相對合理,又比較快速的評估模型的效能是非常重要的普碎。
下面是一個相對完整的評估流程吼肥,一個相對來說較完整的流程包括如下三大模塊:
預(yù)評估;
測試評估麻车;
運營監(jiān)控
1.預(yù)評估
這個階段的主要任務(wù)是通過歷史數(shù)據(jù)的分析缀皱、數(shù)據(jù)測試(如果引入外部測試數(shù)據(jù)的話)對新的模型(數(shù)據(jù)字段)、策略進行預(yù)先評估动猬。
這個階段完全是由分析師在線下完成啤斗,不涉及到任何生產(chǎn)環(huán)境。
這個模塊主要按照順序完成以下幾項工作:
2.對數(shù)據(jù)進行測試
現(xiàn)在所有金融機構(gòu)在測試外部機構(gòu)的數(shù)據(jù)測試時都會做外部測試赁咙,但方法都不太一樣钮莲,個人認為做數(shù)據(jù)測試時主要考察兩方面:
a.真實性測試
也就是說我們要準備一些樣本,我們是能夠完全了解真實情況的人彼水,因此崔拥,這個樣本不會太多,但這個測試能給我們一個對數(shù)據(jù)直觀的了解凤覆;
b.回溯測試
做回溯測試的主要目的是要拿有足夠還款表現(xiàn)的賬戶作為測試樣本链瓦,要求數(shù)據(jù)提供方將數(shù)據(jù)回溯到樣本真實的申請時間去匹配數(shù)據(jù)。
回溯的重要性我就不過多強調(diào)了盯桦,很多公司提供的評分或黑名單產(chǎn)品由于在測試時沒有回溯慈俯。
或僅僅是號稱回溯卻沒有回溯,在測試時可以得到很高的KS拥峦,但是將模型或評分應(yīng)用到真實的業(yè)務(wù)中時卻差強人意贴膘。
如果說是一個新的內(nèi)部評分,我們也一定要將這個新的評分事镣,放到一個有足夠還款表現(xiàn)的樣本上步鉴,用當(dāng)時的數(shù)據(jù)進行打分,這個過程就叫做Backward璃哟。
為什么一定要進行數(shù)據(jù)回溯氛琢?
不管是做策略分析,還是做評分模型随闪,都有一個假設(shè)和一個前提阳似。
一個假設(shè):
用戶行為在時間維度上是保持相對穩(wěn)定的,這個假設(shè)保證了用歷史數(shù)據(jù)做分析铐伴,得到的結(jié)論是在我們應(yīng)用策略和做模型時還能適用撮奏。
一個前提:
在應(yīng)用策略和模型時俏讹,都是在用截止到應(yīng)用時間點能夠獲得的所有信息,這時是無法得知關(guān)于未來任何確定的信息的畜吊。
所以泽疆,我們需要研究的是“歷史加現(xiàn)狀和未來的關(guān)系”。
從上面的假設(shè)和前提玲献,就知道在做分析殉疼、數(shù)據(jù)測試時,就要保證這個前提捌年。
通常我們測試時瓢娜,都會采取那些已知還款表現(xiàn)的樣本,比如礼预,這些樣本都是在2017年1月通過測試的眠砾,如果在測試和分析時,我們把2017年2月之后的數(shù)據(jù)剔除掉托酸。
那么褒颈,通過分析得到的結(jié)論其實是“未來和未來的關(guān)系』窀撸”而不是符合應(yīng)用場景的“歷史加現(xiàn)狀和未來的關(guān)系”哈肖。
我們把觀察用戶表現(xiàn)的那個時間段叫表現(xiàn)窗(performance window),把在審批時用來決定審批結(jié)果獲取數(shù)據(jù)的那個時間窗口叫觀察窗(observation window)念秧。
因此淤井,表現(xiàn)窗和觀察窗是絕對不可能重合的,如果說再做分析提取數(shù)據(jù)和做測試數(shù)據(jù)時摊趾,如果不作回溯的話币狠,那么,其實用表現(xiàn)窗的數(shù)據(jù)去分析表現(xiàn)窗的數(shù)據(jù)砾层,這樣得到的結(jié)論是有很大偏差的漩绵。
① 評估數(shù)據(jù)效能(如果涉及到新的數(shù)據(jù)字段或評分)
在這一步驟中,根據(jù)回溯測試的數(shù)據(jù)肛炮,對數(shù)據(jù)字段或評分進行評估止吐。
如果不是評分,而是一個數(shù)據(jù)字段侨糟,我們完全可以把這個數(shù)據(jù)字段看作一個自由度比較低的評分碍扔。
然后,我們就可以直接應(yīng)用我之前的速算評估公式來進行判斷了秕重。
通過數(shù)據(jù)效能評估不同,我們可以大概知道這個數(shù)據(jù)或模型能否滿足我們的基本需求,是否值得我們花精力去開發(fā)響應(yīng)的規(guī)則策略而產(chǎn)生額外的數(shù)據(jù)購買成本。
② 模型與策略開發(fā)
如果數(shù)據(jù)字段的區(qū)分能力已經(jīng)可以直接用到規(guī)則中二拐,那么服鹅,這時可以直接通過數(shù)據(jù)表現(xiàn)來確定閾值,將該字段放入規(guī)則中百新。
如果數(shù)據(jù)字段的區(qū)分能力不足以直接進入規(guī)則企软,那么,就需要開發(fā)一個新的模型饭望,將這個字段引入已有的A卡或B卡中澜倦,然后再將新的模型引入規(guī)則。
對新策略進行盈利分析杰妓。
根據(jù)新的字段或模型研發(fā)出的審核策略,除了在開發(fā)流程中要考慮的通過率和逾期率的影響以外碘勉,還應(yīng)該全面的評估新策略對于審核成本巷挥,獲客成本,客戶體驗验靡,對壞賬的影響等等倍宾。
考慮的因素基本就可以參照我的速算公式,但是在進行財務(wù)預(yù)測的時候要更加的嚴謹胜嗓,各項參數(shù)還要考慮到未來的變化高职。
③ 測試評估
經(jīng)過了一個完整的預(yù)測評估流程,說明經(jīng)過歷史數(shù)據(jù)的評估辞州,已經(jīng)證明將要上線的數(shù)據(jù)怔锌、模型、策略是有價值的变过。
同時埃元,之前的評估都是由數(shù)據(jù)部門或風(fēng)險部門的分析師完成的,還未涉及到系統(tǒng)的開發(fā)對接媚狰。
測試評估主要分為兩個階段:
a 模擬上線階段
通過系統(tǒng)對接岛杀、開發(fā)、測試崭孤,那么类嗤,新模型和策略已經(jīng)在系統(tǒng)中等待調(diào)用了。
但從謹慎角度看辨宠,這并不能直接將相關(guān)策略應(yīng)用在真實的用戶上遗锣,很多同學(xué)都知道要做冠軍挑戰(zhàn)者的測試,但從測試完整性和謹慎的角度彭羹,模擬上線測試是要先進行的黄伊。
模擬線上測試其實是將新策略在真實的業(yè)務(wù)環(huán)境中運行一段時間,記錄相關(guān)結(jié)果派殷,但運行哦不影響真實的業(yè)務(wù)運行还最。模擬測試中要注意兩點:
b 冠軍挑戰(zhàn)者測試
通過模擬上線測試下一步墓阀,就要開始將一小部分真實的用戶切換到新的策略中了,將現(xiàn)有的規(guī)則(冠軍)和新規(guī)則(挑戰(zhàn)者)進行比較拓轻;
同時斯撮,冠軍挑戰(zhàn)者測試并不是一次性的,而是一個動態(tài)的過程扶叉。
應(yīng)該根據(jù)測試的結(jié)果勿锅,不斷調(diào)整冠軍和挑戰(zhàn)者的用戶比例,根據(jù)產(chǎn)品的用戶規(guī)模枣氧,這個動態(tài)的過程可快可慢溢十,但總的方向是不斷擴大挑戰(zhàn)者測試的用戶規(guī)模。
通過了冠軍挑戰(zhàn)者測試达吞,就可以將現(xiàn)有策略淘汰了张弛,但并不是數(shù)據(jù)評估的過程就結(jié)束了,下面就要開始第三個模塊了酪劫。
3.運營監(jiān)控
在新的模型吞鸭、策略規(guī)則完全上線后,并不意味著可以當(dāng)甩手掌柜了覆糟,因為運營監(jiān)控是一個長期且沒有止境的過程刻剥,直到這個新模型“退休”。
運營監(jiān)控需要做如下幾項工作:
第三方數(shù)據(jù)源的穩(wěn)定性滩字。包括查得率造虏,字段數(shù)據(jù)分布等。
模型和策略的后端的穩(wěn)定性麦箍。包括模型各項數(shù)據(jù)指標的穩(wěn)定性酗电;各個規(guī)則的漏斗率。
舉個例子:
數(shù)據(jù)風(fēng)控那點事
這是某個指標連續(xù)14天的變化趨勢内列,往返上升或下降撵术,通常在第14個點會觸發(fā)我們的監(jiān)控規(guī)則。
如上面三個方面的穩(wěn)定性發(fā)生明顯偏差時话瞧,就需要采取相應(yīng)對策了嫩与,對數(shù)據(jù)源、策略交排、模型進行調(diào)整划滋。
大數(shù)據(jù)風(fēng)控是Fintech中的一項跟我們行業(yè)息息相關(guān)的技術(shù),因為它能顯著提高企業(yè)的生產(chǎn)率和盈利能力埃篓,能為客戶提供更好的服務(wù)體驗处坪。
我們要把金融科技風(fēng)控能力賦能合作伙伴,進行全流程的金融科技轉(zhuǎn)型需要的不僅僅是技術(shù)。
萬事開頭難同窘,如果各位有志青年想進入這個行業(yè)時玄帕,順勢而為,有興趣的好好學(xué)數(shù)學(xué)想邦,做做模型風(fēng)控裤纹。希望行業(yè)越來越好,大家越來越好丧没!
數(shù)據(jù)風(fēng)控那點事
ZRobot是由數(shù)字科技公司京東金融成立的金融科技公司鹰椒。
基于高維度變量,結(jié)合豐富的應(yīng)用場景呕童,利用數(shù)據(jù)挖掘和機器學(xué)習(xí)等專業(yè)技術(shù)漆际,致力于構(gòu)建大數(shù)據(jù)背景下的信用生態(tài)體系。
作為京東金融旗下智能數(shù)據(jù)技術(shù)服務(wù)商夺饲,以大數(shù)據(jù)和靈活完善的風(fēng)控模型為基礎(chǔ)灿椅,實時評估業(yè)務(wù)風(fēng)險,為銀行钞支、消費金融公司、汽車金融等金融機構(gòu)提供智能化風(fēng)控管理解決方案操刀,提升企業(yè)整體風(fēng)控能力烁挟。
*文章為講者獨立觀點,不代表筆記俠立場骨坑。