本文導(dǎo)航
1、前言
2、接口應(yīng)用常見問題冗余重復(fù)
質(zhì)量不一软能、成本不同迎捺、格式各異
3、我們的經(jīng)驗
前言
有人說13年是大數(shù)據(jù)元年查排,14年是互聯(lián)網(wǎng)金融元年凳枝,而15年是消費金融元年,不論哪種說法跋核,都在說一件事岖瑰,近幾年來互聯(lián)網(wǎng)背景下的大數(shù)據(jù)和消費金融在中國可謂是風(fēng)生水起,一時無兩砂代。
如今無論線下和線上锭环,還是定期理財和信用借貸,各種金融產(chǎn)品已經(jīng)琳瑯滿目繁花似錦泊藕,互聯(lián)網(wǎng)消費金融出現(xiàn)了空前的繁榮。在互聯(lián)網(wǎng)架起的高速路上难礼,金融的列車在風(fēng)馳電掣娃圆,然而與之相伴的不只是快速的發(fā)展和豐厚的回報,還有各種暗流涌動的風(fēng)險蛾茉。為了應(yīng)對和控制風(fēng)險讼呢,業(yè)界在大數(shù)據(jù)風(fēng)控領(lǐng)域的研究也在不斷的發(fā)展和上升。
本期我們拋磚引玉谦炬,講講我們在探索大數(shù)據(jù)反欺詐過程中的遇到的問題和總結(jié)的經(jīng)驗悦屏。
常見的問題
伴隨著互聯(lián)網(wǎng)消費信貸的發(fā)展,大數(shù)據(jù)與反欺詐風(fēng)險的切實需求相結(jié)合键思,市面上出現(xiàn)了各式各樣的反欺詐服務(wù)和產(chǎn)品础爬,與我們合作的供應(yīng)商已經(jīng)超過50家,在使用中會碰到哪些問題吼鳞,又該如何利用好這些服務(wù)或產(chǎn)品是大家一直很關(guān)心的看蚜,下面是我們總結(jié)的幾點。
1赔桌、冗余重復(fù)
每家服務(wù)商擅長的領(lǐng)域是有差別的供炎,有的提供核身驗證(人臉識別、實名認(rèn)證等)服務(wù)疾党,有的匯集電信運營商數(shù)據(jù)(核實手機電話等通訊信息等)音诫,有的提供負(fù)面信息(犯罪、司法等)核查雪位,有的提供借貸記錄(逾期時間竭钝、金額、嚴(yán)重程度等),有的提供多頭借貸(借款機構(gòu)平臺數(shù)等)蜓氨,還有很多其他各式各樣的行為數(shù)據(jù)或評分等聋袋。豐富的種類給數(shù)據(jù)應(yīng)用打開了很多扇門,但也出現(xiàn)了很多冗余重復(fù)的情況穴吹,比如幾家服務(wù)商都有黑名單數(shù)據(jù)但來源幾乎是同一個幽勒。
2、質(zhì)量不一
每家數(shù)據(jù)服務(wù)商所提供數(shù)據(jù)的質(zhì)量也是各有各的問題港令。從風(fēng)險評估的粒度上看啥容,有的只提供匯總的評分,有的只提供明細(xì)顷霹,有的既有評分也有明細(xì)咪惠。從風(fēng)險攔截的效果上講,有的服務(wù)商數(shù)據(jù)準(zhǔn)確程度高但只能覆蓋一小部分有風(fēng)險的人淋淀,有的準(zhǔn)確程度低但覆蓋的風(fēng)險人群范圍大遥昧。質(zhì)量不一帶來的差異,使得我們在應(yīng)用接口數(shù)據(jù)時不能一概而論朵纷,要經(jīng)過謹(jǐn)慎的效果評估炭臭,否則會誤傷太多,影響產(chǎn)品體驗袍辞。
3鞋仍、成本不同
各家數(shù)據(jù)服務(wù)商在收費定價上也是千差萬別。有的服務(wù)商查詢即收費(查一條收一次費)搅吁,有的查得才收費(查到壞人才收費)威创,有的則有免費條數(shù)(在一定數(shù)量內(nèi)免費查,超出才收費)谎懦。對某些小額的產(chǎn)品使用高價的接口肚豺,會造成入不敷出,產(chǎn)品收益還不足以覆蓋接口成本党瓮,成本也是接口應(yīng)用中必須考慮的一個問題详炬。
4、格式各異
每家服務(wù)商的在系統(tǒng)對接上各有各式寞奸,返回的數(shù)據(jù)格式各有特色呛谜,有的服務(wù)商提供的數(shù)據(jù)一個人一行記錄,有的則一個人多行記錄枪萄,有的一個人一行記錄但某個字段會包含多個變量而且存放無序隐岛。要將各個接口的數(shù)據(jù)整合起來,對一個人做統(tǒng)一的多方位評估瓷翻,數(shù)據(jù)存儲的格式問題是要首先解決的聚凹。
我們的經(jīng)驗
面對以上問題割坠,如何有效的評估和應(yīng)用這些接口,并在量化的基礎(chǔ)上做到成本的最優(yōu)化妒牙,我們探索并歸結(jié)了一個“總分總”方案彼哼。
總
第一個總是“制定統(tǒng)一的評估標(biāo)準(zhǔn),使用相同的測試樣本”湘今,統(tǒng)一的評估標(biāo)準(zhǔn)方便理解和效果解釋敢朱,相同的測試樣本則可以使不同接口效果可以比較。
分
第二個分是“接口分類規(guī)則細(xì)分摩瞎,樣本分場景分時間”拴签,接口分類規(guī)則細(xì)分是要明確接口提供哪方面的服務(wù)和提供哪些維度的判斷,樣本要分場景分時間收集則是為了使評估更全面并實現(xiàn)不同場景效果差異的可區(qū)分旗们。
總
第三個總是“規(guī)則分級蚓哩,風(fēng)險評分,統(tǒng)一應(yīng)用”上渴,“統(tǒng)一應(yīng)用”不是使用完全一樣的口徑做輸出岸梨,而是在“規(guī)則分級”和“風(fēng)險評分”的基礎(chǔ)上達(dá)到規(guī)則和評分的靈活應(yīng)用和部署〕淼“規(guī)則分級”是根據(jù)規(guī)則效果形成不同等級的規(guī)則包盛嘿,我們可以根據(jù)規(guī)則準(zhǔn)確率遞減和覆蓋率遞減,形成如下的規(guī)則矩陣括袒,如圖:
每個服務(wù)商的每條規(guī)則都會分布到矩陣的某個格子里,相同等級的規(guī)則聚集在一起稿茉∏旅蹋“風(fēng)險評分”則是搭建評分模型,匯總申請人在身份特質(zhì)漓库、風(fēng)險記錄恃慧、高危行為、多頭借貸和惡意逾期等維度的數(shù)據(jù)渺蒿,綜合評估申請人群的欺詐風(fēng)險痢士。
“統(tǒng)一應(yīng)用”的關(guān)鍵在于權(quán)衡在不同的規(guī)則等級和風(fēng)險評分下,反欺詐體系的準(zhǔn)確率和覆蓋率如何茂装,考慮在保證或達(dá)到多少的風(fēng)險覆蓋時規(guī)則會達(dá)到怎樣的準(zhǔn)確率怠蹂,同時將付出多少征信成本,輸出通過少态、拒絕還是人工城侧。
大數(shù)據(jù)反欺詐,不僅是博采眾家之?dāng)?shù)據(jù)彼妻,更是用眾家數(shù)據(jù)之長嫌佑。