數(shù)據(jù)風(fēng)控那點事

數(shù)據(jù)風(fēng)控那點事

數(shù)據(jù)風(fēng)控那點事

活動筆記·大數(shù)據(jù)

本文優(yōu)質(zhì)度:★★★★★ 口感:內(nèi)蒙古牛肉

筆記俠說:

一、數(shù)據(jù)風(fēng)控

是一個什么樣的行業(yè)湾宙?

數(shù)據(jù)是大數(shù)據(jù)風(fēng)控的核心妒御,數(shù)據(jù)的量級要大解愤,數(shù)據(jù)的維度要多、數(shù)據(jù)的迭代速度要快乎莉,立體多維迭代快才能體現(xiàn)數(shù)據(jù)的真正價值送讲。

而風(fēng)控是對市場、信用及實操層面的風(fēng)險控制惋啃。

大數(shù)據(jù)風(fēng)控的直觀感受哼鬓,它是能將相似的人更精準地分群,既能讓你看到形形色色的人边灭,又能讓你從豐富的單一數(shù)據(jù)中看到萬千的世界异希。

做數(shù)據(jù)做模型要了解人和業(yè)務(wù)場景才能夠更準確的進行實踐應(yīng)用。

1.數(shù)據(jù)風(fēng)控的目的是什么绒瘦?

當(dāng)我們想去銀行辦一筆貸款時称簿,從客戶的角度扣癣,大概流程是這樣的。

數(shù)據(jù)風(fēng)控那點事

當(dāng)我們換個角度予跌,從銀行的角度搏色,流程又是這樣的。

數(shù)據(jù)風(fēng)控那點事

從上面兩張圖看起來券册,其中有一個重要環(huán)節(jié)频轿,即在貸款申請人提交了申請資料后,銀行需要對貸款人的申請資料進行審核烁焙。

畢竟銀行要給你錢航邢,銀行總要知道你的還款能力,而不是說拿了錢就跑骄蝇。

怎么審核膳殷?

只有一個辦法,用機器(主要是電腦)來提高勞動生產(chǎn)率九火,把成本降低到能讓企業(yè)賺錢的程度赚窃。

但用電腦代替人有一個很重要的前提是,用數(shù)字去描述人的各種行為岔激,并且要把這些描述邏輯寫成電腦程序勒极,以便電腦可執(zhí)行。

簡單來講虑鼎,用電腦代替人來進行貸款審核辱匿,需要如下四類職位共同來協(xié)作完成(畢竟他們需要的專業(yè)知識還是有相當(dāng)差距的),而且實際情況非常復(fù)雜炫彩。

業(yè)務(wù)人員:主要確定金融產(chǎn)品的相關(guān)細節(jié)匾七,他們了解客戶的需求和金融相關(guān)的知識,同時江兢,他們也是所有需求的發(fā)起者昨忆。

數(shù)據(jù)分析師:這類職位的主要作用是把業(yè)務(wù)需求轉(zhuǎn)化為數(shù)學(xué)邏輯。

IT研發(fā):這類職位則把數(shù)據(jù)分析師所得到的數(shù)學(xué)邏輯寫成計算機程序和代碼划址。

IT運維:這類職位的主要作用是保證電腦的正常運行扔嵌,不要死機。

當(dāng)然夺颤,實際情況是職位之間會相互交叉。

同時也會有更多的職位胁勺,大數(shù)據(jù)風(fēng)控我認為就是數(shù)據(jù)分析師和業(yè)務(wù)人員的結(jié)合體世澜,把人對風(fēng)險的判斷轉(zhuǎn)換成電腦可以識別的數(shù)學(xué)邏輯;

通過數(shù)據(jù)的分析進一步提供挖掘出更多有利于我們對客戶風(fēng)險的判斷署穗。

2. 做好數(shù)據(jù)風(fēng)控需要掌握什么技能寥裂?

一名合格的數(shù)據(jù)風(fēng)控嵌洼,不僅需要掌握很多技能,還要有各種相關(guān)的實操經(jīng)驗封恰。

有些技能是硬功夫麻养,也就是那種通過短期的突擊培訓(xùn)就能相對熟練掌握的技能;

有些技能是看的見诺舔,摸不著的鳖昌,需要時間和項目去不斷積累才能掌握的技能。

① 代碼能力

代碼能力是作為一個數(shù)據(jù)風(fēng)控的基礎(chǔ)中的基礎(chǔ)低飒,如果一個入門的員工連這項能力都沒有许昨,而其他能力又不夠吸引人,那么褥赊,在絕大多數(shù)急功近利的企業(yè)中糕档,根本不會有任何機會。

一名數(shù)據(jù)風(fēng)控需要掌握的技能拌喉,基礎(chǔ)是SQL速那,R,Python尿背,SAS中的任意一樣端仰,不過,其中的SAS目前在國內(nèi)用的人越來越少残家。

如果能同時掌握2~3項技能榆俺,還有一個精通,那就很棒了坞淮。

② 數(shù)學(xué)基礎(chǔ)

這里的數(shù)學(xué)基礎(chǔ)主要是概率論和數(shù)理統(tǒng)計中的主要內(nèi)容茴晋,包括均值、方差回窘、假設(shè)檢驗诺擅、回歸分析等內(nèi)容。

另外啡直,為了跟上目前機器學(xué)習(xí)這個熱點烁涌,最好學(xué)習(xí)一些相關(guān)的決策樹算法、離散數(shù)學(xué)酒觅、運籌學(xué)撮执、最優(yōu)化等方面的內(nèi)容。

③ 數(shù)學(xué)建模能力

這個既可簡單舷丹,也可復(fù)雜抒钱。

往簡單來說,就是按照行業(yè)已有的套路把模型做出來,雖然很多地方不知道為什么谋币,但只要按照規(guī)矩走仗扬,跟著做幾個項目,就出不了大問題蕾额。

往復(fù)雜去說早芭,其實,數(shù)據(jù)風(fēng)控就是將業(yè)務(wù)問題轉(zhuǎn)換為一個個數(shù)學(xué)的問題诅蝶,去求解和分析退个。

雖說行業(yè)中常碰到的問題也就十幾種,但能在不同機構(gòu)把這些事情實打?qū)嵉淖鲆槐槌由矣凶约旱乃伎己桶l(fā)揮帜乞,這種機會不會天天有的。

④ 銀行業(yè)的基礎(chǔ)知識

同樣筐眷,如果簡單的話黎烈,只要搞清楚你們家的房貸利息是怎么算出來的,在各種情況下匀谣,違約金怎么算照棋,每個月的還款金額是怎么算出來的,到底有幾種還款方式武翎;

往復(fù)雜里說烈炭,目前主流的個人信貸產(chǎn)品特征、費用構(gòu)成宝恶、主要客群等信息符隙。

像《貨幣銀行學(xué)》、《宏觀經(jīng)濟學(xué)》垫毙、《微觀經(jīng)濟學(xué)》以及近年來特別流行的相關(guān)書籍霹疫,包括我們國家跟銀行業(yè)、征信業(yè)相關(guān)的監(jiān)管機構(gòu)综芥、職能及法律法規(guī)丽蝎,跟風(fēng)控相關(guān)的上下游產(chǎn)業(yè)以及比較主流的黑產(chǎn)等都需要有所了解。

⑤ 數(shù)據(jù)知識

數(shù)據(jù)是數(shù)據(jù)風(fēng)控的原材料膀藐,沒有這些原材料一切都無從談起屠阻。

那么,我們國家目前針對不同等級的個人信貸產(chǎn)品额各,能夠在業(yè)務(wù)流程中獲取到的數(shù)據(jù)有哪些国觉?每種數(shù)據(jù)不同來源有哪些?都有哪些數(shù)據(jù)供應(yīng)商蛉加?

數(shù)據(jù)的主要獲取方式缸逃、當(dāng)前的主流價格针饥、每種數(shù)據(jù)在使用中涉及到的優(yōu)點和問題等丁眼。

⑥ 行業(yè)和業(yè)務(wù)經(jīng)驗

很多事情就像一層窗戶紙一樣昭殉,原理很簡單,但別人不跟你說就很難明白挪丢。

這些經(jīng)驗包括在不同場景下常用的風(fēng)險策略、在突發(fā)情況發(fā)生時常用的應(yīng)對方法惠啄、風(fēng)險策略的決策機制、如何與IT部門溝通風(fēng)控需求以及怎么寫各種文檔等撵渡。

這個行業(yè)和其他行業(yè)一樣,都是從別人告訴你怎么做死嗦,到自己明白怎么做趋距,再到告訴別人怎么做這一個曲折上升的過程。

但唯一不變的就是變化越除,尤其是我們這個行業(yè)的相關(guān)知識的迭代速度可能相對于其他行業(yè)更快节腐,逆水行舟,不進則退摘盆。

二翼雀、如何從零構(gòu)建信貸業(yè)務(wù)的

大數(shù)據(jù)風(fēng)控能力?

其實骡澈,從零構(gòu)建信貸業(yè)務(wù)的大數(shù)據(jù)風(fēng)控能力有點浮夸锅纺,也沒這個水準真正的從0做起,我們都是站在了巨人的肩膀上肋殴。

很多人應(yīng)該都沒有經(jīng)過一項信貸業(yè)務(wù)真正從零做起囤锉,不過,你經(jīng)歷過后护锤,一般都會有“人生大起大落官地,實在是太刺激了”的感覺。

建立一個名副其實的具有大數(shù)據(jù)風(fēng)控能力的金融科技企業(yè)烙懦,一般會經(jīng)歷這幾個階段:一窮二白驱入、盲人摸象、小有積累、日積月累亏较。

1.一窮二白:拍腦袋

在產(chǎn)品上線前莺褒,一般來講,沒有任何數(shù)據(jù)可以分析雪情,唯一能借鑒的就是我們在之前的工作中積攢的經(jīng)驗遵岩。

產(chǎn)品形態(tài):

是最先確定下來的,因為這是后面所有一切的基礎(chǔ)巡通。

這里的產(chǎn)品形態(tài)包括額度范圍尘执、還款方式和綜合息費水平宴凉;

關(guān)于產(chǎn)品弥锄,還有一個非常重要的方面則是還款方式和還款提醒這一點經(jīng)常被人們忽略窘行。

其中現(xiàn)金貸這個市場與傳統(tǒng)金融熟知的面向優(yōu)質(zhì)人群的信貸市場有一個最大的差別在于:借款人的素質(zhì)罐盔。

這個人群有幾個特點需要引起注意:

① 一個人通常一個月有很多個還款節(jié)點惶看;

② 不是特別在乎征信纬黎,而且平臺主動報送的積極性和通道都有問題;

③ 自控能力差冠息,一般都是有錢就花的主逛艰。

風(fēng)險策略和數(shù)據(jù)供應(yīng)商:

它們會相互影響散怖,而且是直接取決于我們的產(chǎn)品形態(tài)镇眷,因為你要參考市場競品的產(chǎn)品流程丹诀,不能為了控制風(fēng)險而影響了用戶的體驗;

同時沿猜,對于有些數(shù)據(jù)啼肩,如果沒有成熟的供應(yīng)商祈坠,那么赦拘,在開發(fā)力量有限的情況下,也很可能無法完成采集蹋艺,而能夠獲取到的數(shù)據(jù)又會直接影響到我們在不確定風(fēng)險政策時潛在的可能性捎谨。

根據(jù)產(chǎn)品邏輯涛救、目標客群以及能夠?qū)拥降臄?shù)據(jù)源州叠,拍拍腦袋逆甜,把風(fēng)險策略定下來交煞,就可以進行下面的步驟了素征。

需要注意的是御毅,這個階段端蛆,模型大概有如下幾種情況:

① 這里的模型就是代指拍腦袋的規(guī)則酥泛;

② 這個模型是從別處“借鑒”來的呆躲;

③ 從外部采購了一部分捶索。

在確定了基本的風(fēng)險策略和數(shù)據(jù)供應(yīng)商后燥筷,進行接口的對接也有不小的工作量肆氓,尤其是大名鼎鼎的運營商強授權(quán)數(shù)據(jù)谢揪。

決策引擎:

決策引擎應(yīng)該很多人聽過拨扶,不過出于種種原因患民,它被復(fù)雜和神秘化了匹颤。

其實印蓖,決策引擎最核心的功能是在用戶發(fā)起申請后溅蛉,能夠從眾多數(shù)據(jù)源或內(nèi)部數(shù)據(jù)庫中將決策所需要的數(shù)據(jù)調(diào)用過來船侧。

將數(shù)據(jù)進行處理后勺爱,根據(jù)預(yù)先設(shè)定好的風(fēng)險規(guī)則進行判斷,并可以輸出決策結(jié)果(是否授信人灼、額度投放、利率等),主流的決策引擎軟件烙样,包括FICO的BLAZE谒获,Experian的 SMG3等批狱。

決策引擎在開發(fā)中的難點主要是兼容性赔硫,規(guī)則的靈活配置权悟,輔助BI(商業(yè)智能)和熱拔插僵芹。

但在業(yè)務(wù)的這個階段小槐,這些功能的優(yōu)先級都不是那么高凿跳,因此茧彤,程序員的hard code(指的是在軟體實作上,把輸出或輸入的相關(guān)參數(shù) 「例如:路徑曾掂、輸出的形式、格式」直接寫死在原始碼中)是性價比最高的實現(xiàn)方式许蓖。

這一階段團隊需要具備的能力:

① 能有一個比較靠譜的風(fēng)險規(guī)則膊爪,這個一定需要至少在個人零售信貸領(lǐng)域制定過風(fēng)險策略的經(jīng)驗;

② 能夠針對產(chǎn)品特點淮逻,梳理產(chǎn)品可能存在的風(fēng)險點爬早,經(jīng)驗要求同上;

③ 能夠?qū)L(fēng)險規(guī)則和產(chǎn)品需求轉(zhuǎn)化為IT需求桨啃,這個經(jīng)驗要求至少是能夠做簡單的數(shù)據(jù)分析照瘾,能寫一些簡單的代碼的產(chǎn)品經(jīng)理析命。

④ 能夠?qū)⑸鲜鲂枨笤诤笈_實現(xiàn)簇搅,并且能夠保證系統(tǒng)的穩(wěn)定運行的研發(fā)能力软吐,這個主要要求有相當(dāng)時間的后臺開發(fā)經(jīng)驗瘩将,最好是信貸行業(yè)。

⑤ 最好對目前市場上成熟的數(shù)據(jù)供應(yīng)商有相當(dāng)?shù)牧私獍及遥ǚ?wù)形式姿现,大概市場價格等等。

2.盲人摸象:碰運氣

這個階段通常是在產(chǎn)品上線及前三個還款周期結(jié)束前肖抱,之所以稱其為盲人摸象建钥,是因為這個階段,只有申請數(shù)據(jù)虐沥,而沒有足夠的還款表現(xiàn)泽艘,就像盲人摸象一樣然低,只能摸到片面吨灭,而不是整體。

在這個階段郭变,我們的大數(shù)據(jù)風(fēng)控團隊除了檢測這個規(guī)則體系的平穩(wěn)運行以外横辆,還必須做如下幾個事:

① 開發(fā)一個定時將業(yè)務(wù)數(shù)據(jù)脫敏,并導(dǎo)出到一個獨立數(shù)據(jù)庫的功能;

② 確定風(fēng)險監(jiān)控的基本框架和觀測特征集命咐,建立一個簡單的風(fēng)險BI平臺沛善;

③ 通過對申請數(shù)據(jù)的分析胀葱,錨定實際客群的特征搂抒;

做這幾件事情的目的只有一個,即能夠在最短的時間捕捉到客群的風(fēng)險趨勢垮媒,做出最快的響應(yīng)。

這個階段團隊需要具有的能力除了第一階段的幾個外士袄,還需要幾個新技能,包括:

① 使用SQL或python或R或SAS從數(shù)據(jù)庫蕉朵、文本文件中提取想要的數(shù)據(jù)進行分析的能力隆夯,此處的要求至少有類似的數(shù)據(jù)分析經(jīng)驗,當(dāng)然溯捆,代碼能力超強的除外;

② 知道此類數(shù)據(jù)庫的設(shè)計倘要,因為做分析的數(shù)據(jù)庫結(jié)構(gòu),跟做業(yè)務(wù)用的數(shù)據(jù)庫結(jié)構(gòu)是不太一樣的仔涩,所以,經(jīng)驗要求至少是在一個成熟的企業(yè)做類似的事情霞揉。

③ 知道如何設(shè)計常規(guī)的風(fēng)險監(jiān)控報表,這個一般也是要求至少在個人零售信貸領(lǐng)域制定過風(fēng)險策略的經(jīng)驗;

④ 知道如何設(shè)計海量指標的監(jiān)測的報表和將風(fēng)險監(jiān)控數(shù)據(jù)轉(zhuǎn)化為分析需求的能力彪见,這個要求相對較高柴钻,大概就是把上面三個技能的要求加在一起;

⑤ 出色的文檔和日志能力上沐,前期策略變化可能會比較頻繁皮服,如果不把變化一一記錄下來,后面出現(xiàn)問題將無處可查参咙。

3.小有積累 :打補丁

經(jīng)歷了前期的大起大落龄广,這時已經(jīng)積累了“具有統(tǒng)計意義的”數(shù)據(jù)了,這個階段的主要任務(wù)如下:

① 不斷做案例分析蕴侧,積累經(jīng)驗择同。

做案例分析時,很多人看到所謂的“壞”樣本净宵,某種行為發(fā)生的頻率很高敲才,就斷定一個很好的指標裹纳。

但其實這才是案例分析的第一步,當(dāng)發(fā)現(xiàn)一個符合“好指標”定義指標后紧武,一定要把它放在你的好客戶里剃氧,看看是不是也是這樣,如果是阻星,那就說明也許只是客群特征而不是“壞客戶”特征朋鞍。

如果不是,那么恭喜妥箕,確實“可能”找到了一個很好的指標滥酥。

② 嘗試做模型。

在這種情況下矾踱,由于在中前期的數(shù)據(jù)量的問題恨狈,不是特別推薦使用機器學(xué)習(xí)算法進行建模,尤其是使用默認參數(shù)的機器學(xué)習(xí)模型呛讲,更推薦使用相對傳統(tǒng)的評分卡模型或邏輯回歸模型禾怠,畢竟這些模型是小透明,風(fēng)險相對可控贝搁。

③ 建立一套模型監(jiān)控和迭代的系統(tǒng)吗氏。

由于數(shù)據(jù)量小,模型的穩(wěn)定性非常容易受到客群變化的影響雷逆,一套行之有效的模型監(jiān)控和迭代流程是很有必要的弦讽。

由于模型不是那種“一出場就穩(wěn)了”的科技,因此膀哲,把指標監(jiān)控和案例分析及配套的策略管理做好往产,是非常重要的。

4.日積月累:筑城墻

通過不斷的業(yè)務(wù)積累某宪,對于企業(yè)來講已經(jīng)獲得了下面幾樣非常寶貴的東西仿村,尤其是第一個:

三、如何“謹慎的”進行數(shù)據(jù)評估兴喂?

不管是引入一個外部評分還是企業(yè)內(nèi)部研發(fā)了一個新的內(nèi)部評分蔼囊,基于這個新評分制定相應(yīng)的策略、再到新策略的上線是一個非常漫長衣迷、復(fù)雜和涉及多部門協(xié)作的過程畏鼓。

但作為一個一線的模型人員或者數(shù)據(jù)測試人員來說,后面這個過程的變數(shù)很大壶谒,時間和人力成本很高云矫,不可能每評估一個模型都把全流程走一遍;

另一個方面汗菜,如前面強調(diào)的让禀,那些數(shù)學(xué)指標更多的是參考價值贵少,畢竟數(shù)學(xué)和業(yè)務(wù)中間還是有一段距離。

那么堆缘,是否有什么簡易的方法相對合理,又比較快速的評估模型的效能是非常重要的普碎。

下面是一個相對完整的評估流程吼肥,一個相對來說較完整的流程包括如下三大模塊:

預(yù)評估;

測試評估麻车;

運營監(jiān)控

1.預(yù)評估

這個階段的主要任務(wù)是通過歷史數(shù)據(jù)的分析缀皱、數(shù)據(jù)測試(如果引入外部測試數(shù)據(jù)的話)對新的模型(數(shù)據(jù)字段)、策略進行預(yù)先評估动猬。

這個階段完全是由分析師在線下完成啤斗,不涉及到任何生產(chǎn)環(huán)境。

這個模塊主要按照順序完成以下幾項工作:

2.對數(shù)據(jù)進行測試

現(xiàn)在所有金融機構(gòu)在測試外部機構(gòu)的數(shù)據(jù)測試時都會做外部測試赁咙,但方法都不太一樣钮莲,個人認為做數(shù)據(jù)測試時主要考察兩方面:

a.真實性測試

也就是說我們要準備一些樣本,我們是能夠完全了解真實情況的人彼水,因此崔拥,這個樣本不會太多,但這個測試能給我們一個對數(shù)據(jù)直觀的了解凤覆;

b.回溯測試

做回溯測試的主要目的是要拿有足夠還款表現(xiàn)的賬戶作為測試樣本链瓦,要求數(shù)據(jù)提供方將數(shù)據(jù)回溯到樣本真實的申請時間去匹配數(shù)據(jù)。

回溯的重要性我就不過多強調(diào)了盯桦,很多公司提供的評分或黑名單產(chǎn)品由于在測試時沒有回溯慈俯。

或僅僅是號稱回溯卻沒有回溯,在測試時可以得到很高的KS拥峦,但是將模型或評分應(yīng)用到真實的業(yè)務(wù)中時卻差強人意贴膘。

如果說是一個新的內(nèi)部評分,我們也一定要將這個新的評分事镣,放到一個有足夠還款表現(xiàn)的樣本上步鉴,用當(dāng)時的數(shù)據(jù)進行打分,這個過程就叫做Backward璃哟。

為什么一定要進行數(shù)據(jù)回溯氛琢?

不管是做策略分析,還是做評分模型随闪,都有一個假設(shè)和一個前提阳似。

一個假設(shè):

用戶行為在時間維度上是保持相對穩(wěn)定的,這個假設(shè)保證了用歷史數(shù)據(jù)做分析铐伴,得到的結(jié)論是在我們應(yīng)用策略和做模型時還能適用撮奏。

一個前提:

在應(yīng)用策略和模型時俏讹,都是在用截止到應(yīng)用時間點能夠獲得的所有信息,這時是無法得知關(guān)于未來任何確定的信息的畜吊。

所以泽疆,我們需要研究的是“歷史加現(xiàn)狀和未來的關(guān)系”。

從上面的假設(shè)和前提玲献,就知道在做分析殉疼、數(shù)據(jù)測試時,就要保證這個前提捌年。

通常我們測試時瓢娜,都會采取那些已知還款表現(xiàn)的樣本,比如礼预,這些樣本都是在2017年1月通過測試的眠砾,如果在測試和分析時,我們把2017年2月之后的數(shù)據(jù)剔除掉托酸。

那么褒颈,通過分析得到的結(jié)論其實是“未來和未來的關(guān)系』窀撸”而不是符合應(yīng)用場景的“歷史加現(xiàn)狀和未來的關(guān)系”哈肖。

我們把觀察用戶表現(xiàn)的那個時間段叫表現(xiàn)窗(performance window),把在審批時用來決定審批結(jié)果獲取數(shù)據(jù)的那個時間窗口叫觀察窗(observation window)念秧。

因此淤井,表現(xiàn)窗和觀察窗是絕對不可能重合的,如果說再做分析提取數(shù)據(jù)和做測試數(shù)據(jù)時摊趾,如果不作回溯的話币狠,那么,其實用表現(xiàn)窗的數(shù)據(jù)去分析表現(xiàn)窗的數(shù)據(jù)砾层,這樣得到的結(jié)論是有很大偏差的漩绵。

① 評估數(shù)據(jù)效能(如果涉及到新的數(shù)據(jù)字段或評分)

在這一步驟中,根據(jù)回溯測試的數(shù)據(jù)肛炮,對數(shù)據(jù)字段或評分進行評估止吐。

如果不是評分,而是一個數(shù)據(jù)字段侨糟,我們完全可以把這個數(shù)據(jù)字段看作一個自由度比較低的評分碍扔。

然后,我們就可以直接應(yīng)用我之前的速算評估公式來進行判斷了秕重。

通過數(shù)據(jù)效能評估不同,我們可以大概知道這個數(shù)據(jù)或模型能否滿足我們的基本需求,是否值得我們花精力去開發(fā)響應(yīng)的規(guī)則策略而產(chǎn)生額外的數(shù)據(jù)購買成本。

② 模型與策略開發(fā)

如果數(shù)據(jù)字段的區(qū)分能力已經(jīng)可以直接用到規(guī)則中二拐,那么服鹅,這時可以直接通過數(shù)據(jù)表現(xiàn)來確定閾值,將該字段放入規(guī)則中百新。

如果數(shù)據(jù)字段的區(qū)分能力不足以直接進入規(guī)則企软,那么,就需要開發(fā)一個新的模型饭望,將這個字段引入已有的A卡或B卡中澜倦,然后再將新的模型引入規(guī)則。

對新策略進行盈利分析杰妓。

根據(jù)新的字段或模型研發(fā)出的審核策略,除了在開發(fā)流程中要考慮的通過率和逾期率的影響以外碘勉,還應(yīng)該全面的評估新策略對于審核成本巷挥,獲客成本,客戶體驗验靡,對壞賬的影響等等倍宾。

考慮的因素基本就可以參照我的速算公式,但是在進行財務(wù)預(yù)測的時候要更加的嚴謹胜嗓,各項參數(shù)還要考慮到未來的變化高职。

③ 測試評估

經(jīng)過了一個完整的預(yù)測評估流程,說明經(jīng)過歷史數(shù)據(jù)的評估辞州,已經(jīng)證明將要上線的數(shù)據(jù)怔锌、模型、策略是有價值的变过。

同時埃元,之前的評估都是由數(shù)據(jù)部門或風(fēng)險部門的分析師完成的,還未涉及到系統(tǒng)的開發(fā)對接媚狰。

測試評估主要分為兩個階段:

a 模擬上線階段

通過系統(tǒng)對接岛杀、開發(fā)、測試崭孤,那么类嗤,新模型和策略已經(jīng)在系統(tǒng)中等待調(diào)用了。

但從謹慎角度看辨宠,這并不能直接將相關(guān)策略應(yīng)用在真實的用戶上遗锣,很多同學(xué)都知道要做冠軍挑戰(zhàn)者的測試,但從測試完整性和謹慎的角度彭羹,模擬上線測試是要先進行的黄伊。

模擬線上測試其實是將新策略在真實的業(yè)務(wù)環(huán)境中運行一段時間,記錄相關(guān)結(jié)果派殷,但運行哦不影響真實的業(yè)務(wù)運行还最。模擬測試中要注意兩點:

b 冠軍挑戰(zhàn)者測試

通過模擬上線測試下一步墓阀,就要開始將一小部分真實的用戶切換到新的策略中了,將現(xiàn)有的規(guī)則(冠軍)和新規(guī)則(挑戰(zhàn)者)進行比較拓轻;

同時斯撮,冠軍挑戰(zhàn)者測試并不是一次性的,而是一個動態(tài)的過程扶叉。

應(yīng)該根據(jù)測試的結(jié)果勿锅,不斷調(diào)整冠軍和挑戰(zhàn)者的用戶比例,根據(jù)產(chǎn)品的用戶規(guī)模枣氧,這個動態(tài)的過程可快可慢溢十,但總的方向是不斷擴大挑戰(zhàn)者測試的用戶規(guī)模。

通過了冠軍挑戰(zhàn)者測試达吞,就可以將現(xiàn)有策略淘汰了张弛,但并不是數(shù)據(jù)評估的過程就結(jié)束了,下面就要開始第三個模塊了酪劫。

3.運營監(jiān)控

在新的模型吞鸭、策略規(guī)則完全上線后,并不意味著可以當(dāng)甩手掌柜了覆糟,因為運營監(jiān)控是一個長期且沒有止境的過程刻剥,直到這個新模型“退休”。

運營監(jiān)控需要做如下幾項工作:

第三方數(shù)據(jù)源的穩(wěn)定性滩字。包括查得率造虏,字段數(shù)據(jù)分布等。

模型和策略的后端的穩(wěn)定性麦箍。包括模型各項數(shù)據(jù)指標的穩(wěn)定性酗电;各個規(guī)則的漏斗率。

舉個例子:

數(shù)據(jù)風(fēng)控那點事

這是某個指標連續(xù)14天的變化趨勢内列,往返上升或下降撵术,通常在第14個點會觸發(fā)我們的監(jiān)控規(guī)則。

如上面三個方面的穩(wěn)定性發(fā)生明顯偏差時话瞧,就需要采取相應(yīng)對策了嫩与,對數(shù)據(jù)源、策略交排、模型進行調(diào)整划滋。

大數(shù)據(jù)風(fēng)控是Fintech中的一項跟我們行業(yè)息息相關(guān)的技術(shù),因為它能顯著提高企業(yè)的生產(chǎn)率和盈利能力埃篓,能為客戶提供更好的服務(wù)體驗处坪。

我們要把金融科技風(fēng)控能力賦能合作伙伴,進行全流程的金融科技轉(zhuǎn)型需要的不僅僅是技術(shù)。

萬事開頭難同窘,如果各位有志青年想進入這個行業(yè)時玄帕,順勢而為,有興趣的好好學(xué)數(shù)學(xué)想邦,做做模型風(fēng)控裤纹。希望行業(yè)越來越好,大家越來越好丧没!

數(shù)據(jù)風(fēng)控那點事

ZRobot是由數(shù)字科技公司京東金融成立的金融科技公司鹰椒。

基于高維度變量,結(jié)合豐富的應(yīng)用場景呕童,利用數(shù)據(jù)挖掘和機器學(xué)習(xí)等專業(yè)技術(shù)漆际,致力于構(gòu)建大數(shù)據(jù)背景下的信用生態(tài)體系。

作為京東金融旗下智能數(shù)據(jù)技術(shù)服務(wù)商夺饲,以大數(shù)據(jù)和靈活完善的風(fēng)控模型為基礎(chǔ)灿椅,實時評估業(yè)務(wù)風(fēng)險,為銀行钞支、消費金融公司、汽車金融等金融機構(gòu)提供智能化風(fēng)控管理解決方案操刀,提升企業(yè)整體風(fēng)控能力烁挟。

*文章為講者獨立觀點,不代表筆記俠立場骨坑。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末撼嗓,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子欢唾,更是在濱河造成了極大的恐慌且警,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件礁遣,死亡現(xiàn)場離奇詭異斑芜,居然都是意外死亡,警方通過查閱死者的電腦和手機祟霍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進店門杏头,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人沸呐,你說我怎么就攤上這事醇王。” “怎么了崭添?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵寓娩,是天一觀的道長。 經(jīng)常有香客問我,道長棘伴,這世上最難降的妖魔是什么寞埠? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮排嫌,結(jié)果婚禮上畸裳,老公的妹妹穿的比我還像新娘。我一直安慰自己淳地,他們只是感情好怖糊,可當(dāng)我...
    茶點故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著颇象,像睡著了一般伍伤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上遣钳,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天扰魂,我揣著相機與錄音,去河邊找鬼蕴茴。 笑死劝评,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的倦淀。 我是一名探鬼主播蒋畜,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼撞叽!你這毒婦竟也來了姻成?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤愿棋,失蹤者是張志新(化名)和其女友劉穎科展,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體糠雨,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡才睹,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了甘邀。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片砂竖。...
    茶點故事閱讀 39,769評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖鹃答,靈堂內(nèi)的尸體忽然破棺而出乎澄,到底是詐尸還是另有隱情,我是刑警寧澤测摔,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布置济,位于F島的核電站解恰,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏浙于。R本人自食惡果不足惜护盈,卻給世界環(huán)境...
    茶點故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望羞酗。 院中可真熱鬧腐宋,春花似錦、人聲如沸檀轨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽参萄。三九已至卫枝,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間讹挎,已是汗流浹背校赤。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留筒溃,地道東北人马篮。 一個月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像怜奖,于是被迫代替她去往敵國和親浑测。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容