數(shù)據(jù)風(fēng)控那點事

活動筆記·大數(shù)據(jù)

本文優(yōu)質(zhì)度：★★★★★ 口感：內(nèi)蒙古牛肉

筆記俠說：

一、數(shù)據(jù)風(fēng)控

是一個什么樣的行業(yè)湾宙？

數(shù)據(jù)是大數(shù)據(jù)風(fēng)控的核心妒御，數(shù)據(jù)的量級要大解愤，數(shù)據(jù)的維度要多、數(shù)據(jù)的迭代速度要快乎莉，立體多維迭代快才能體現(xiàn)數(shù)據(jù)的真正價值送讲。

而風(fēng)控是對市場、信用及實操層面的風(fēng)險控制惋啃。

大數(shù)據(jù)風(fēng)控的直觀感受哼鬓，它是能將相似的人更精準地分群，既能讓你看到形形色色的人边灭，又能讓你從豐富的單一數(shù)據(jù)中看到萬千的世界异希。

做數(shù)據(jù)做模型要了解人和業(yè)務(wù)場景才能夠更準確的進行實踐應(yīng)用。

1.數(shù)據(jù)風(fēng)控的目的是什么绒瘦？

當(dāng)我們想去銀行辦一筆貸款時称簿，從客戶的角度扣癣，大概流程是這樣的。

數(shù)據(jù)風(fēng)控那點事

當(dāng)我們換個角度予跌，從銀行的角度搏色，流程又是這樣的。

數(shù)據(jù)風(fēng)控那點事

從上面兩張圖看起來券册，其中有一個重要環(huán)節(jié)频轿，即在貸款申請人提交了申請資料后，銀行需要對貸款人的申請資料進行審核烁焙。

畢竟銀行要給你錢航邢，銀行總要知道你的還款能力，而不是說拿了錢就跑骄蝇。

怎么審核膳殷？

只有一個辦法，用機器（主要是電腦）來提高勞動生產(chǎn)率九火，把成本降低到能讓企業(yè)賺錢的程度赚窃。

但用電腦代替人有一個很重要的前提是，用數(shù)字去描述人的各種行為岔激，并且要把這些描述邏輯寫成電腦程序勒极，以便電腦可執(zhí)行。

簡單來講虑鼎，用電腦代替人來進行貸款審核辱匿，需要如下四類職位共同來協(xié)作完成（畢竟他們需要的專業(yè)知識還是有相當(dāng)差距的），而且實際情況非常復(fù)雜炫彩。

業(yè)務(wù)人員：主要確定金融產(chǎn)品的相關(guān)細節(jié)匾七，他們了解客戶的需求和金融相關(guān)的知識，同時江兢，他們也是所有需求的發(fā)起者昨忆。

數(shù)據(jù)分析師：這類職位的主要作用是把業(yè)務(wù)需求轉(zhuǎn)化為數(shù)學(xué)邏輯。

IT研發(fā)：這類職位則把數(shù)據(jù)分析師所得到的數(shù)學(xué)邏輯寫成計算機程序和代碼划址。

IT運維：這類職位的主要作用是保證電腦的正常運行扔嵌，不要死機。

當(dāng)然夺颤，實際情況是職位之間會相互交叉。

同時也會有更多的職位胁勺，大數(shù)據(jù)風(fēng)控我認為就是數(shù)據(jù)分析師和業(yè)務(wù)人員的結(jié)合體世澜，把人對風(fēng)險的判斷轉(zhuǎn)換成電腦可以識別的數(shù)學(xué)邏輯；

通過數(shù)據(jù)的分析進一步提供挖掘出更多有利于我們對客戶風(fēng)險的判斷署穗。

2. 做好數(shù)據(jù)風(fēng)控需要掌握什么技能寥裂？

一名合格的數(shù)據(jù)風(fēng)控嵌洼，不僅需要掌握很多技能，還要有各種相關(guān)的實操經(jīng)驗封恰。

有些技能是硬功夫麻养，也就是那種通過短期的突擊培訓(xùn)就能相對熟練掌握的技能；

有些技能是看的見诺舔，摸不著的鳖昌，需要時間和項目去不斷積累才能掌握的技能。

① 代碼能力

代碼能力是作為一個數(shù)據(jù)風(fēng)控的基礎(chǔ)中的基礎(chǔ)低飒，如果一個入門的員工連這項能力都沒有许昨，而其他能力又不夠吸引人，那么褥赊，在絕大多數(shù)急功近利的企業(yè)中糕档，根本不會有任何機會。

一名數(shù)據(jù)風(fēng)控需要掌握的技能拌喉，基礎(chǔ)是SQL速那，R，Python尿背，SAS中的任意一樣端仰，不過，其中的SAS目前在國內(nèi)用的人越來越少残家。

如果能同時掌握2~3項技能榆俺，還有一個精通，那就很棒了坞淮。

② 數(shù)學(xué)基礎(chǔ)

這里的數(shù)學(xué)基礎(chǔ)主要是概率論和數(shù)理統(tǒng)計中的主要內(nèi)容茴晋，包括均值、方差回窘、假設(shè)檢驗诺擅、回歸分析等內(nèi)容。

另外啡直，為了跟上目前機器學(xué)習(xí)這個熱點烁涌，最好學(xué)習(xí)一些相關(guān)的決策樹算法、離散數(shù)學(xué)酒觅、運籌學(xué)撮执、最優(yōu)化等方面的內(nèi)容。

③ 數(shù)學(xué)建模能力

這個既可簡單舷丹，也可復(fù)雜抒钱。

往簡單來說，就是按照行業(yè)已有的套路把模型做出來，雖然很多地方不知道為什么谋币，但只要按照規(guī)矩走仗扬，跟著做幾個項目，就出不了大問題蕾额。

往復(fù)雜去說早芭，其實，數(shù)據(jù)風(fēng)控就是將業(yè)務(wù)問題轉(zhuǎn)換為一個個數(shù)學(xué)的問題诅蝶，去求解和分析退个。

雖說行業(yè)中常碰到的問題也就十幾種，但能在不同機構(gòu)把這些事情實打?qū)嵉淖鲆槐槌由矣凶约旱乃伎己桶l(fā)揮帜乞，這種機會不會天天有的。

④ 銀行業(yè)的基礎(chǔ)知識

同樣筐眷，如果簡單的話黎烈，只要搞清楚你們家的房貸利息是怎么算出來的，在各種情況下匀谣，違約金怎么算照棋，每個月的還款金額是怎么算出來的，到底有幾種還款方式武翎；

往復(fù)雜里說烈炭，目前主流的個人信貸產(chǎn)品特征、費用構(gòu)成宝恶、主要客群等信息符隙。

像《貨幣銀行學(xué)》、《宏觀經(jīng)濟學(xué)》垫毙、《微觀經(jīng)濟學(xué)》以及近年來特別流行的相關(guān)書籍霹疫，包括我們國家跟銀行業(yè)、征信業(yè)相關(guān)的監(jiān)管機構(gòu)综芥、職能及法律法規(guī)丽蝎，跟風(fēng)控相關(guān)的上下游產(chǎn)業(yè)以及比較主流的黑產(chǎn)等都需要有所了解。

⑤ 數(shù)據(jù)知識

數(shù)據(jù)是數(shù)據(jù)風(fēng)控的原材料膀藐，沒有這些原材料一切都無從談起屠阻。

那么，我們國家目前針對不同等級的個人信貸產(chǎn)品额各，能夠在業(yè)務(wù)流程中獲取到的數(shù)據(jù)有哪些国觉？每種數(shù)據(jù)不同來源有哪些？都有哪些數(shù)據(jù)供應(yīng)商蛉加？

數(shù)據(jù)的主要獲取方式缸逃、當(dāng)前的主流價格针饥、每種數(shù)據(jù)在使用中涉及到的優(yōu)點和問題等丁眼。

⑥ 行業(yè)和業(yè)務(wù)經(jīng)驗

很多事情就像一層窗戶紙一樣昭殉，原理很簡單，但別人不跟你說就很難明白挪丢。

這些經(jīng)驗包括在不同場景下常用的風(fēng)險策略、在突發(fā)情況發(fā)生時常用的應(yīng)對方法惠啄、風(fēng)險策略的決策機制、如何與IT部門溝通風(fēng)控需求以及怎么寫各種文檔等撵渡。

這個行業(yè)和其他行業(yè)一樣，都是從別人告訴你怎么做死嗦，到自己明白怎么做趋距，再到告訴別人怎么做這一個曲折上升的過程。

但唯一不變的就是變化越除，尤其是我們這個行業(yè)的相關(guān)知識的迭代速度可能相對于其他行業(yè)更快节腐，逆水行舟，不進則退摘盆。

二翼雀、如何從零構(gòu)建信貸業(yè)務(wù)的

大數(shù)據(jù)風(fēng)控能力？

其實骡澈，從零構(gòu)建信貸業(yè)務(wù)的大數(shù)據(jù)風(fēng)控能力有點浮夸锅纺，也沒這個水準真正的從0做起，我們都是站在了巨人的肩膀上肋殴。

很多人應(yīng)該都沒有經(jīng)過一項信貸業(yè)務(wù)真正從零做起囤锉，不過，你經(jīng)歷過后护锤，一般都會有“人生大起大落官地，實在是太刺激了”的感覺。

建立一個名副其實的具有大數(shù)據(jù)風(fēng)控能力的金融科技企業(yè)烙懦，一般會經(jīng)歷這幾個階段：一窮二白驱入、盲人摸象、小有積累、日積月累亏较。

1.一窮二白：拍腦袋

在產(chǎn)品上線前莺褒，一般來講，沒有任何數(shù)據(jù)可以分析雪情，唯一能借鑒的就是我們在之前的工作中積攢的經(jīng)驗遵岩。

產(chǎn)品形態(tài)：

是最先確定下來的，因為這是后面所有一切的基礎(chǔ)巡通。

這里的產(chǎn)品形態(tài)包括額度范圍尘执、還款方式和綜合息費水平宴凉；

關(guān)于產(chǎn)品弥锄，還有一個非常重要的方面則是還款方式和還款提醒這一點經(jīng)常被人們忽略窘行。

其中現(xiàn)金貸這個市場與傳統(tǒng)金融熟知的面向優(yōu)質(zhì)人群的信貸市場有一個最大的差別在于：借款人的素質(zhì)罐盔。

這個人群有幾個特點需要引起注意：

① 一個人通常一個月有很多個還款節(jié)點惶看；

② 不是特別在乎征信纬黎，而且平臺主動報送的積極性和通道都有問題；

③ 自控能力差冠息，一般都是有錢就花的主逛艰。

風(fēng)險策略和數(shù)據(jù)供應(yīng)商：

它們會相互影響散怖，而且是直接取決于我們的產(chǎn)品形態(tài)镇眷，因為你要參考市場競品的產(chǎn)品流程丹诀，不能為了控制風(fēng)險而影響了用戶的體驗；

同時沿猜，對于有些數(shù)據(jù)啼肩，如果沒有成熟的供應(yīng)商祈坠，那么赦拘，在開發(fā)力量有限的情況下，也很可能無法完成采集蹋艺，而能夠獲取到的數(shù)據(jù)又會直接影響到我們在不確定風(fēng)險政策時潛在的可能性捎谨。

根據(jù)產(chǎn)品邏輯涛救、目標客群以及能夠?qū)拥降臄?shù)據(jù)源州叠，拍拍腦袋逆甜，把風(fēng)險策略定下來交煞，就可以進行下面的步驟了素征。

需要注意的是御毅，這個階段端蛆，模型大概有如下幾種情況：

① 這里的模型就是代指拍腦袋的規(guī)則酥泛；

② 這個模型是從別處“借鑒”來的呆躲；

③ 從外部采購了一部分捶索。

在確定了基本的風(fēng)險策略和數(shù)據(jù)供應(yīng)商后燥筷，進行接口的對接也有不小的工作量肆氓，尤其是大名鼎鼎的運營商強授權(quán)數(shù)據(jù)谢揪。

決策引擎：

決策引擎應(yīng)該很多人聽過拨扶，不過出于種種原因患民，它被復(fù)雜和神秘化了匹颤。

其實印蓖，決策引擎最核心的功能是在用戶發(fā)起申請后溅蛉，能夠從眾多數(shù)據(jù)源或內(nèi)部數(shù)據(jù)庫中將決策所需要的數(shù)據(jù)調(diào)用過來船侧。

將數(shù)據(jù)進行處理后勺爱，根據(jù)預(yù)先設(shè)定好的風(fēng)險規(guī)則進行判斷，并可以輸出決策結(jié)果（是否授信人灼、額度投放、利率等），主流的決策引擎軟件烙样，包括FICO的BLAZE谒获，Experian的 SMG3等批狱。

決策引擎在開發(fā)中的難點主要是兼容性赔硫，規(guī)則的靈活配置权悟，輔助BI（商業(yè)智能）和熱拔插僵芹。

但在業(yè)務(wù)的這個階段小槐，這些功能的優(yōu)先級都不是那么高凿跳，因此茧彤，程序員的hard code（指的是在軟體實作上,把輸出或輸入的相關(guān)參數(shù) 「例如:路徑曾掂、輸出的形式、格式」直接寫死在原始碼中）是性價比最高的實現(xiàn)方式许蓖。

這一階段團隊需要具備的能力：

① 能有一個比較靠譜的風(fēng)險規(guī)則膊爪，這個一定需要至少在個人零售信貸領(lǐng)域制定過風(fēng)險策略的經(jīng)驗；

② 能夠針對產(chǎn)品特點淮逻，梳理產(chǎn)品可能存在的風(fēng)險點爬早，經(jīng)驗要求同上；

③ 能夠?qū)L(fēng)險規(guī)則和產(chǎn)品需求轉(zhuǎn)化為IT需求桨啃，這個經(jīng)驗要求至少是能夠做簡單的數(shù)據(jù)分析照瘾，能寫一些簡單的代碼的產(chǎn)品經(jīng)理析命。

④ 能夠?qū)⑸鲜鲂枨笤诤笈_實現(xiàn)簇搅，并且能夠保證系統(tǒng)的穩(wěn)定運行的研發(fā)能力软吐，這個主要要求有相當(dāng)時間的后臺開發(fā)經(jīng)驗瘩将，最好是信貸行業(yè)。

⑤ 最好對目前市場上成熟的數(shù)據(jù)供應(yīng)商有相當(dāng)?shù)牧私獍及遥ǚ?wù)形式姿现，大概市場價格等等。

2.盲人摸象：碰運氣

這個階段通常是在產(chǎn)品上線及前三個還款周期結(jié)束前肖抱，之所以稱其為盲人摸象建钥，是因為這個階段，只有申請數(shù)據(jù)虐沥，而沒有足夠的還款表現(xiàn)泽艘，就像盲人摸象一樣然低，只能摸到片面吨灭，而不是整體。

在這個階段郭变，我們的大數(shù)據(jù)風(fēng)控團隊除了檢測這個規(guī)則體系的平穩(wěn)運行以外横辆，還必須做如下幾個事：

① 開發(fā)一個定時將業(yè)務(wù)數(shù)據(jù)脫敏，并導(dǎo)出到一個獨立數(shù)據(jù)庫的功能；

② 確定風(fēng)險監(jiān)控的基本框架和觀測特征集命咐，建立一個簡單的風(fēng)險BI平臺沛善；

③ 通過對申請數(shù)據(jù)的分析胀葱，錨定實際客群的特征搂抒；

做這幾件事情的目的只有一個，即能夠在最短的時間捕捉到客群的風(fēng)險趨勢垮媒，做出最快的響應(yīng)。

這個階段團隊需要具有的能力除了第一階段的幾個外士袄，還需要幾個新技能，包括：

① 使用SQL或python或R或SAS從數(shù)據(jù)庫蕉朵、文本文件中提取想要的數(shù)據(jù)進行分析的能力隆夯，此處的要求至少有類似的數(shù)據(jù)分析經(jīng)驗，當(dāng)然溯捆，代碼能力超強的除外；

② 知道此類數(shù)據(jù)庫的設(shè)計倘要，因為做分析的數(shù)據(jù)庫結(jié)構(gòu)，跟做業(yè)務(wù)用的數(shù)據(jù)庫結(jié)構(gòu)是不太一樣的仔涩，所以，經(jīng)驗要求至少是在一個成熟的企業(yè)做類似的事情霞揉。

③ 知道如何設(shè)計常規(guī)的風(fēng)險監(jiān)控報表，這個一般也是要求至少在個人零售信貸領(lǐng)域制定過風(fēng)險策略的經(jīng)驗；

④ 知道如何設(shè)計海量指標的監(jiān)測的報表和將風(fēng)險監(jiān)控數(shù)據(jù)轉(zhuǎn)化為分析需求的能力彪见，這個要求相對較高柴钻，大概就是把上面三個技能的要求加在一起；

⑤ 出色的文檔和日志能力上沐，前期策略變化可能會比較頻繁皮服，如果不把變化一一記錄下來，后面出現(xiàn)問題將無處可查参咙。

3.小有積累：打補丁

經(jīng)歷了前期的大起大落龄广，這時已經(jīng)積累了“具有統(tǒng)計意義的”數(shù)據(jù)了，這個階段的主要任務(wù)如下：

① 不斷做案例分析蕴侧，積累經(jīng)驗择同。

做案例分析時，很多人看到所謂的“壞”樣本净宵，某種行為發(fā)生的頻率很高敲才，就斷定一個很好的指標裹纳。

但其實這才是案例分析的第一步，當(dāng)發(fā)現(xiàn)一個符合“好指標”定義指標后紧武，一定要把它放在你的好客戶里剃氧，看看是不是也是這樣，如果是阻星，那就說明也許只是客群特征而不是“壞客戶”特征朋鞍。

如果不是，那么恭喜妥箕，確實“可能”找到了一個很好的指標滥酥。

② 嘗試做模型。

在這種情況下矾踱，由于在中前期的數(shù)據(jù)量的問題恨狈，不是特別推薦使用機器學(xué)習(xí)算法進行建模，尤其是使用默認參數(shù)的機器學(xué)習(xí)模型呛讲，更推薦使用相對傳統(tǒng)的評分卡模型或邏輯回歸模型禾怠，畢竟這些模型是小透明，風(fēng)險相對可控贝搁。

③ 建立一套模型監(jiān)控和迭代的系統(tǒng)吗氏。

由于數(shù)據(jù)量小，模型的穩(wěn)定性非常容易受到客群變化的影響雷逆，一套行之有效的模型監(jiān)控和迭代流程是很有必要的弦讽。

由于模型不是那種“一出場就穩(wěn)了”的科技，因此膀哲，把指標監(jiān)控和案例分析及配套的策略管理做好往产，是非常重要的。

4.日積月累：筑城墻

通過不斷的業(yè)務(wù)積累某宪，對于企業(yè)來講已經(jīng)獲得了下面幾樣非常寶貴的東西仿村，尤其是第一個：

三、如何“謹慎的”進行數(shù)據(jù)評估兴喂？

不管是引入一個外部評分還是企業(yè)內(nèi)部研發(fā)了一個新的內(nèi)部評分蔼囊，基于這個新評分制定相應(yīng)的策略、再到新策略的上線是一個非常漫長衣迷、復(fù)雜和涉及多部門協(xié)作的過程畏鼓。

但作為一個一線的模型人員或者數(shù)據(jù)測試人員來說，后面這個過程的變數(shù)很大壶谒，時間和人力成本很高云矫，不可能每評估一個模型都把全流程走一遍；

另一個方面汗菜，如前面強調(diào)的让禀，那些數(shù)學(xué)指標更多的是參考價值贵少，畢竟數(shù)學(xué)和業(yè)務(wù)中間還是有一段距離。

那么堆缘，是否有什么簡易的方法相對合理，又比較快速的評估模型的效能是非常重要的普碎。

下面是一個相對完整的評估流程吼肥，一個相對來說較完整的流程包括如下三大模塊：

預(yù)評估；

測試評估麻车；

運營監(jiān)控

1.預(yù)評估

這個階段的主要任務(wù)是通過歷史數(shù)據(jù)的分析缀皱、數(shù)據(jù)測試（如果引入外部測試數(shù)據(jù)的話）對新的模型（數(shù)據(jù)字段）、策略進行預(yù)先評估动猬。

這個階段完全是由分析師在線下完成啤斗，不涉及到任何生產(chǎn)環(huán)境。

這個模塊主要按照順序完成以下幾項工作：

2.對數(shù)據(jù)進行測試

現(xiàn)在所有金融機構(gòu)在測試外部機構(gòu)的數(shù)據(jù)測試時都會做外部測試赁咙，但方法都不太一樣钮莲，個人認為做數(shù)據(jù)測試時主要考察兩方面：

a.真實性測試

也就是說我們要準備一些樣本，我們是能夠完全了解真實情況的人彼水，因此崔拥，這個樣本不會太多，但這個測試能給我們一個對數(shù)據(jù)直觀的了解凤覆；

b.回溯測試

做回溯測試的主要目的是要拿有足夠還款表現(xiàn)的賬戶作為測試樣本链瓦，要求數(shù)據(jù)提供方將數(shù)據(jù)回溯到樣本真實的申請時間去匹配數(shù)據(jù)。

回溯的重要性我就不過多強調(diào)了盯桦，很多公司提供的評分或黑名單產(chǎn)品由于在測試時沒有回溯慈俯。

或僅僅是號稱回溯卻沒有回溯，在測試時可以得到很高的KS拥峦，但是將模型或評分應(yīng)用到真實的業(yè)務(wù)中時卻差強人意贴膘。

如果說是一個新的內(nèi)部評分，我們也一定要將這個新的評分事镣，放到一個有足夠還款表現(xiàn)的樣本上步鉴，用當(dāng)時的數(shù)據(jù)進行打分，這個過程就叫做Backward璃哟。

為什么一定要進行數(shù)據(jù)回溯氛琢？

不管是做策略分析，還是做評分模型随闪，都有一個假設(shè)和一個前提阳似。

一個假設(shè)：

用戶行為在時間維度上是保持相對穩(wěn)定的，這個假設(shè)保證了用歷史數(shù)據(jù)做分析铐伴，得到的結(jié)論是在我們應(yīng)用策略和做模型時還能適用撮奏。

一個前提：

在應(yīng)用策略和模型時俏讹，都是在用截止到應(yīng)用時間點能夠獲得的所有信息，這時是無法得知關(guān)于未來任何確定的信息的畜吊。

所以泽疆，我們需要研究的是“歷史加現(xiàn)狀和未來的關(guān)系”。

從上面的假設(shè)和前提玲献，就知道在做分析殉疼、數(shù)據(jù)測試時，就要保證這個前提捌年。

通常我們測試時瓢娜，都會采取那些已知還款表現(xiàn)的樣本，比如礼预，這些樣本都是在2017年1月通過測試的眠砾，如果在測試和分析時，我們把2017年2月之后的數(shù)據(jù)剔除掉托酸。

那么褒颈，通過分析得到的結(jié)論其實是“未來和未來的關(guān)系』窀撸”而不是符合應(yīng)用場景的“歷史加現(xiàn)狀和未來的關(guān)系”哈肖。

我們把觀察用戶表現(xiàn)的那個時間段叫表現(xiàn)窗（performance window），把在審批時用來決定審批結(jié)果獲取數(shù)據(jù)的那個時間窗口叫觀察窗（observation window）念秧。

因此淤井，表現(xiàn)窗和觀察窗是絕對不可能重合的，如果說再做分析提取數(shù)據(jù)和做測試數(shù)據(jù)時摊趾，如果不作回溯的話币狠，那么，其實用表現(xiàn)窗的數(shù)據(jù)去分析表現(xiàn)窗的數(shù)據(jù)砾层，這樣得到的結(jié)論是有很大偏差的漩绵。

① 評估數(shù)據(jù)效能（如果涉及到新的數(shù)據(jù)字段或評分）

在這一步驟中，根據(jù)回溯測試的數(shù)據(jù)肛炮，對數(shù)據(jù)字段或評分進行評估止吐。

如果不是評分，而是一個數(shù)據(jù)字段侨糟，我們完全可以把這個數(shù)據(jù)字段看作一個自由度比較低的評分碍扔。

然后，我們就可以直接應(yīng)用我之前的速算評估公式來進行判斷了秕重。

通過數(shù)據(jù)效能評估不同，我們可以大概知道這個數(shù)據(jù)或模型能否滿足我們的基本需求，是否值得我們花精力去開發(fā)響應(yīng)的規(guī)則策略而產(chǎn)生額外的數(shù)據(jù)購買成本。

② 模型與策略開發(fā)

如果數(shù)據(jù)字段的區(qū)分能力已經(jīng)可以直接用到規(guī)則中二拐，那么服鹅，這時可以直接通過數(shù)據(jù)表現(xiàn)來確定閾值，將該字段放入規(guī)則中百新。

如果數(shù)據(jù)字段的區(qū)分能力不足以直接進入規(guī)則企软，那么，就需要開發(fā)一個新的模型饭望，將這個字段引入已有的A卡或B卡中澜倦，然后再將新的模型引入規(guī)則。

對新策略進行盈利分析杰妓。

根據(jù)新的字段或模型研發(fā)出的審核策略，除了在開發(fā)流程中要考慮的通過率和逾期率的影響以外碘勉，還應(yīng)該全面的評估新策略對于審核成本巷挥，獲客成本，客戶體驗验靡，對壞賬的影響等等倍宾。

考慮的因素基本就可以參照我的速算公式，但是在進行財務(wù)預(yù)測的時候要更加的嚴謹胜嗓，各項參數(shù)還要考慮到未來的變化高职。

③ 測試評估

經(jīng)過了一個完整的預(yù)測評估流程，說明經(jīng)過歷史數(shù)據(jù)的評估辞州，已經(jīng)證明將要上線的數(shù)據(jù)怔锌、模型、策略是有價值的变过。

同時埃元，之前的評估都是由數(shù)據(jù)部門或風(fēng)險部門的分析師完成的，還未涉及到系統(tǒng)的開發(fā)對接媚狰。

測試評估主要分為兩個階段：

a 模擬上線階段

通過系統(tǒng)對接岛杀、開發(fā)、測試崭孤，那么类嗤，新模型和策略已經(jīng)在系統(tǒng)中等待調(diào)用了。

但從謹慎角度看辨宠，這并不能直接將相關(guān)策略應(yīng)用在真實的用戶上遗锣，很多同學(xué)都知道要做冠軍挑戰(zhàn)者的測試，但從測試完整性和謹慎的角度彭羹，模擬上線測試是要先進行的黄伊。

模擬線上測試其實是將新策略在真實的業(yè)務(wù)環(huán)境中運行一段時間，記錄相關(guān)結(jié)果派殷，但運行哦不影響真實的業(yè)務(wù)運行还最。模擬測試中要注意兩點：

b 冠軍挑戰(zhàn)者測試

通過模擬上線測試下一步墓阀，就要開始將一小部分真實的用戶切換到新的策略中了，將現(xiàn)有的規(guī)則（冠軍）和新規(guī)則（挑戰(zhàn)者）進行比較拓轻；

同時斯撮，冠軍挑戰(zhàn)者測試并不是一次性的，而是一個動態(tài)的過程扶叉。

應(yīng)該根據(jù)測試的結(jié)果勿锅，不斷調(diào)整冠軍和挑戰(zhàn)者的用戶比例，根據(jù)產(chǎn)品的用戶規(guī)模枣氧，這個動態(tài)的過程可快可慢溢十，但總的方向是不斷擴大挑戰(zhàn)者測試的用戶規(guī)模。

通過了冠軍挑戰(zhàn)者測試达吞，就可以將現(xiàn)有策略淘汰了张弛，但并不是數(shù)據(jù)評估的過程就結(jié)束了，下面就要開始第三個模塊了酪劫。

3.運營監(jiān)控

在新的模型吞鸭、策略規(guī)則完全上線后，并不意味著可以當(dāng)甩手掌柜了覆糟，因為運營監(jiān)控是一個長期且沒有止境的過程刻剥，直到這個新模型“退休”。

運營監(jiān)控需要做如下幾項工作：

第三方數(shù)據(jù)源的穩(wěn)定性滩字。包括查得率造虏，字段數(shù)據(jù)分布等。

模型和策略的后端的穩(wěn)定性麦箍。包括模型各項數(shù)據(jù)指標的穩(wěn)定性酗电；各個規(guī)則的漏斗率。

舉個例子：

數(shù)據(jù)風(fēng)控那點事

這是某個指標連續(xù)14天的變化趨勢内列，往返上升或下降撵术，通常在第14個點會觸發(fā)我們的監(jiān)控規(guī)則。

如上面三個方面的穩(wěn)定性發(fā)生明顯偏差時话瞧，就需要采取相應(yīng)對策了嫩与，對數(shù)據(jù)源、策略交排、模型進行調(diào)整划滋。

大數(shù)據(jù)風(fēng)控是Fintech中的一項跟我們行業(yè)息息相關(guān)的技術(shù)，因為它能顯著提高企業(yè)的生產(chǎn)率和盈利能力埃篓，能為客戶提供更好的服務(wù)體驗处坪。

我們要把金融科技風(fēng)控能力賦能合作伙伴，進行全流程的金融科技轉(zhuǎn)型需要的不僅僅是技術(shù)。

萬事開頭難同窘，如果各位有志青年想進入這個行業(yè)時玄帕，順勢而為，有興趣的好好學(xué)數(shù)學(xué)想邦，做做模型風(fēng)控裤纹。希望行業(yè)越來越好，大家越來越好丧没！

數(shù)據(jù)風(fēng)控那點事

ZRobot是由數(shù)字科技公司京東金融成立的金融科技公司鹰椒。

基于高維度變量，結(jié)合豐富的應(yīng)用場景呕童，利用數(shù)據(jù)挖掘和機器學(xué)習(xí)等專業(yè)技術(shù)漆际，致力于構(gòu)建大數(shù)據(jù)背景下的信用生態(tài)體系。

作為京東金融旗下智能數(shù)據(jù)技術(shù)服務(wù)商夺饲，以大數(shù)據(jù)和靈活完善的風(fēng)控模型為基礎(chǔ)灿椅，實時評估業(yè)務(wù)風(fēng)險，為銀行钞支、消費金融公司、汽車金融等金融機構(gòu)提供智能化風(fēng)控管理解決方案操刀，提升企業(yè)整體風(fēng)控能力烁挟。

*文章為講者獨立觀點，不代表筆記俠立場骨坑。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末撼嗓，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子欢唾，更是在濱河造成了極大的恐慌且警，老刑警劉巖，帶你破解...
沈念sama閱讀 216,997評論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件礁遣，死亡現(xiàn)場離奇詭異斑芜，居然都是意外死亡，警方通過查閱死者的電腦和手機祟霍，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,603評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門杏头，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人沸呐，你說我怎么就攤上這事醇王。” “怎么了崭添？”我有些...
開封第一講書人閱讀 163,359評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵寓娩，是天一觀的道長。經(jīng)常有香客問我，道長棘伴，這世上最難降的妖魔是什么寞埠？我笑而不...
開封第一講書人閱讀 58,309評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮排嫌，結(jié)果婚禮上畸裳，老公的妹妹穿的比我還像新娘。我一直安慰自己淳地，他們只是感情好怖糊，可當(dāng)我...
茶點故事閱讀 67,346評論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著颇象，像睡著了一般伍伤。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上遣钳，一...
開封第一講書人閱讀 51,258評論 1贊 300
城市分裂傳說
那天扰魂，我揣著相機與錄音，去河邊找鬼蕴茴。笑死劝评，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的倦淀。我是一名探鬼主播蒋畜，決...
沈念sama閱讀 40,122評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼撞叽！你這毒婦竟也來了姻成？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,970評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤愿棋，失蹤者是張志新（化名）和其女友劉穎科展，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體糠雨，經(jīng)...
沈念sama閱讀 45,403評論 1贊 313
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡才睹，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,596評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了甘邀。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片砂竖。...
茶點故事閱讀 39,769評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖鹃答，靈堂內(nèi)的尸體忽然破棺而出乎澄，到底是詐尸還是另有隱情，我是刑警寧澤测摔，帶...
沈念sama閱讀 35,464評論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布置济，位于F島的核電站解恰，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏浙于。R本人自食惡果不足惜护盈，卻給世界環(huán)境...
茶點故事閱讀 41,075評論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望羞酗。院中可真熱鬧腐宋，春花似錦、人聲如沸檀轨。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,705評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽参萄。三九已至卫枝，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間讹挎，已是汗流浹背校赤。一陣腳步聲響...
開封第一講書人閱讀 32,848評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留筒溃，地道東北人马篮。一個月前我還...
沈念sama閱讀 47,831評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像怜奖，于是被迫代替她去往敵國和親浑测。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,678評論 2贊 354

數(shù)據(jù)風(fēng)控那點事

推薦閱讀更多精彩內(nèi)容