? ? 大數(shù)據能夠進行數(shù)據變現(xiàn)的商業(yè)模式目前就是兩個,一個是精準營銷瞒渠,典型的場景是商品推薦和精準廣告投放,另外一個是大數(shù)據風控技扼,典型的場景是互聯(lián)網金融的大數(shù)據風控。
金融的本質是風險管理嫩痰,風控是所有金融業(yè)務的核心剿吻。典型的金融借貸業(yè)務例如抵押貸款、消費貸款串纺、P2P丽旅、供應鏈金融、以及票據融資都需要數(shù)據風控識別欺詐用戶及評估用戶信用等級纺棺。
傳統(tǒng)金融的風控主要利用了信用屬性強大的金融數(shù)據榄笙,一般采用20個緯度左右的數(shù)據,利用評分來識別客戶的還款能力和還款意愿祷蝌。信用相關程度強的數(shù)據緯度為十個左右茅撞,包含年齡、職業(yè)巨朦、收入米丘、學歷、工作單位糊啡、借貸情況拄查、房產,汽車棚蓄、單位堕扶、還貸記錄等碍脏,金融企業(yè)參考用戶提交的數(shù)據進行打分,最后得到申請人的信用評分稍算,依據評分來決定是否貸款以及貸款額度典尾。其他同信用相關的數(shù)據還有區(qū)域、產品邪蛔、理財方式急黎、行業(yè)、繳款方式侧到、繳款記錄勃教、金額、時間匠抗、頻率等
互聯(lián)網金融的大數(shù)據風控并不是完全改變傳統(tǒng)風控故源,實際是豐富傳統(tǒng)風控的數(shù)據緯度」常互聯(lián)網風控中绳军,首先還是利用信用屬性強的金融數(shù)據,判斷借款人的還款能力和還款意愿矢腻,然后在利用信用屬性較弱的行為數(shù)據進行補充门驾,一般是利用數(shù)據的關聯(lián)分析來判斷借款人的信用情況,借助數(shù)據模型來揭示某些行為特征和信用風險之間的關系多柑。
互聯(lián)網金融公司利用大數(shù)據進行風控時奶是,都是利用多維度數(shù)據來識別借款人風險。同信用相關的數(shù)據越多地被用于借款人風險評估竣灌,借款人的信用風險就被揭示的更充分聂沙,信用評分就會更加客觀,接近借款人實際風險初嘹。常用的互聯(lián)網金融大數(shù)據風控方式有以下幾種及汉;
一、驗證借款人身份
驗證借款人身份的五因素認證是姓名屯烦、手機號坷随、身份證號、銀行卡號驻龟、家庭地址甸箱。企業(yè)可以借助國政通的數(shù)據來驗證姓名、身份證號迅脐,借助銀聯(lián)數(shù)據來驗證銀行卡號和姓名芍殖,利用運營商數(shù)據來驗證手機號、姓名谴蔑、身份證號豌骏、家庭住址龟梦。
如果借款人是欺詐用戶,這五個信息都可以買到窃躲。這個時候就需要進行人臉識別了计贰,人臉識別等原理是調用國政通/公安局 API接口,將申請人實時拍攝的照片/視頻同客戶預留在公安的身份證進行識別蒂窒,通過人臉識別技術驗證申請人是否是借款人本人躁倒。
其他的驗證客戶的方式包括讓客戶出示其他銀行的信用卡及刷卡記錄,或者驗證客戶的學歷證書和身份認證洒琢。
二秧秉、分析提交的信息來識別欺詐
大部分的貸款申請都從線下移到了線上,特別是在互聯(lián)網金融領域衰抑,消費貸和學生貸都是以線上申請為主的象迎。
線上申請時,申請人會按照貸款公司的要求填寫多維度信息例如戶籍地址呛踊,居住地址砾淌,工作單位,單位電話谭网,單位名稱等汪厨。如果是欺詐用戶,其填寫的信息往往會出現(xiàn)一些規(guī)律愉择,企業(yè)可根據異常填寫記錄來識別欺詐劫乱。例如填寫不同城市居住小區(qū)名字相同、填寫的不同城市薄辅,不同單位的電話相同、不同單位的地址街道相同抠璃、單位名稱相同站楚、甚至居住的樓層和號碼都相同。還有一些填寫假的小區(qū)搏嗡、地址和單位名稱以及電話等窿春。
如果企業(yè)發(fā)現(xiàn)一些重復的信息和電話號碼,申請人欺詐的可能性就會很高采盒。
三旧乞、分析客戶線上申請行為來識別欺詐
欺詐用戶往往事先準備好用戶基本信息,在申請過程中磅氨,快速進行填寫尺栖,批量作業(yè),在多家網站進行申請烦租,通過提高申請量來獲得更多的貸款延赌。
企業(yè)可以借助于SDK或JS來采集申請人在各個環(huán)節(jié)的行為除盏,計算客戶閱讀條款的時間,填寫信息的時間挫以,申請貸款的時間等者蠕,如果這些申請時間大大小于正常客戶申請時間掐松,例如填寫地址信息小于2秒踱侣,閱讀條款少于3秒鐘,申請貸款低于20秒等大磺。用戶申請的時間也很關鍵抡句,一般晚上11點以后申請貸款的申請人,欺詐比例和違約比例較高量没。
這些異常申請行為可能揭示申請人具有欺詐傾向玉转,企業(yè)可以結合其他的信息來判斷客戶是否為欺詐用戶。
四殴蹄、利用黑名單和灰名單識別風險
互聯(lián)網金融公司面臨的主要風險為惡意欺詐究抓,70%左右的信貸損失來源于申請人的惡意欺詐∠疲客戶逾期或者違約貸款中至少有30%左右可以收回刺下,另外的一些可以通過催收公司進行催收,M2逾期的回收率在20%左右稽荧。
市場上有近百家的公司從事個人征信相關工作橘茉,其主要的商業(yè)模式是反欺詐識別,灰名單識別姨丈,以及客戶征信評分畅卓。反欺詐識別中,重要的一個參考就是黑名單蟋恬,市場上領先的大數(shù)據風控公司擁有將近1000萬左右的黑名單翁潘,大部分黑名單是過去十多年積累下來的老賴名單,真正有價值的黑名單在兩百萬左右歼争。
黑名單來源于民間借貸拜马、線上P2P、信用卡公司沐绒、小額借貸等公司的歷史違約用戶俩莽,其中很大一部分不再有借貸行為,參考價值有限乔遮。另外一個主要來源是催收公司扮超,催收的成功率一般小于于30%(M3以上的),會產生很多黑名單。
灰名單是逾期但是還沒有達到違約的客戶(逾期少于3個月的客戶)瞒津,灰名單也還意味著多頭借貸蝉衣,申請人在多個貸款平臺進行借貸∠矧剑總借款數(shù)目遠遠超過其還款能力病毡。
黑名單和灰名單是很好的風控方式,但是各個征信公司所擁有的名單僅僅是市場總量的一部分屁柏,很多互聯(lián)網金融公司不得不接入多個風控公司啦膜,來獲得更多的黑名單來提高查得率。央行和上海經信委正在聯(lián)合多家互聯(lián)網金融公司建立統(tǒng)一的黑名單平臺淌喻,但是很多互聯(lián)網金融公司都不太愿意貢獻自家的黑名單僧家,這些黑名單是用真金白銀換來的教訓。另外如果讓外界知道了自家平臺黑名單的數(shù)量裸删,會影響其公司聲譽八拱,降低公司估值,并令投資者質疑其平臺的風控水平涯塔。
五肌稻、利用移動設備數(shù)據識別欺詐
行為數(shù)據中一個比較特殊的就是移動設備數(shù)據反欺詐,公司可以利用移動設備的位置信息來驗證客戶提交的工作地和生活地是否真實匕荸,另外來可以根據設備安裝的應用活躍來識別多頭借貸風險爹谭。
欺詐用戶一般會使用模擬器進行貸款申請,移動大數(shù)據可以識別出貸款人是否使用模擬器榛搔。欺詐用戶也有一些典型特征诺凡,例如很多設備聚集在一個區(qū)域,一起申請貸款践惑。欺詐設備不安裝生活和工具用App腹泌,僅僅安裝和貸款有關的App,可能還安裝了一些密碼破譯軟件或者其他的惡意軟件尔觉。
欺詐用戶還有可能不停更換SIM卡和手機凉袱,利用SIM卡和手機綁定時間和頻次可以識別出部分欺詐用戶。另外欺詐用戶也會購買一些已經淘汰的手機穷娱,其機器上面的操作系統(tǒng)已經過時很久绑蔫,所安裝的App版本都很舊运沦。這些特征可以識別出一些欺詐用戶泵额。
六、利用消費記錄來進行評分
大會數(shù)據風控除了可以識別出壞人携添,還可以評估貸款人的還款能力嫁盲。過去傳統(tǒng)金融依據借款人的收入來判斷其還款能力,但是有些客戶擁有工資以外的收入,例如投資收入羞秤、顧問咨詢收入等缸托。另外一些客戶可能從父母、伴侶瘾蛋、朋友那里獲得其他的財政支持俐镐,擁有較高的支付能力。
按照傳統(tǒng)金融的做法哺哼,在家不工作照顧家庭的主婦可能還款能力較弱佩抹。無法給其提供貸款,但是其丈夫收入很高取董,家庭日常支出由其太太做主棍苹。這種情況,就需要消費數(shù)據來證明其還款能力了茵汰。
常用的消費記錄由銀行卡消費枢里、電商購物、公共事業(yè)費記錄蹂午、大宗商品消費等栏豺。還可以參考航空記錄、手機話費画侣、特殊會員消費等方式冰悠。例如頭等艙乘坐次數(shù),物業(yè)費高低配乱、高爾夫球俱樂部消費溉卓,游艇俱樂部會員費用,奢侈品會員搬泥,豪車4S店消費記錄等消費數(shù)據可以作為其信用評分重要參考桑寨。
互聯(lián)網金融的主要客戶是屌絲,其電商消費記錄忿檩、旅游消費記錄尉尾、以及加油消費記錄都可以作為評估其信用的依據。有的互聯(lián)金融公司專門從事個人電商消費數(shù)據分析燥透,只要客戶授權其登陸電商網站沙咏,其可以借助于工具將客戶歷史消費數(shù)據全部抓取并進行匯總和評分。
七班套、參考社會關系來評估信用情況
物以類聚肢藐,人與群分。一般情況下吱韭,信用好的人吆豹,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低痘煤,
參考借款人常聯(lián)系的朋友信用評分可以評價借款人的信用情況凑阶,一般會采用經常打電話的朋友作為樣本,評估經常聯(lián)系的幾個人(不超過6六個人)的信用評分衷快,去掉一個最高分宙橱,去掉一個最低分,取其中的平均值來判斷借款人的信用蘸拔。這種方式挑戰(zhàn)很大养匈,只是依靠手機號碼來判斷個人信用可信度不高。一般僅僅用于反欺詐識別都伪,利用其經常通話的手機號在黑名單庫里面進行匹配呕乎,如果命中,則此申請人的風險較高陨晶,需要進一步進行調查猬仁。
八、參考借款人社會屬性和行為來評估信用
參考過去互聯(lián)網金融風控的經驗發(fā)現(xiàn)先誉,擁有伴侶和子女的借款人湿刽,其貸款違約率較低;年齡大的人比年齡低的人貸款違約率要高褐耳,其中50歲左右的貸款人違約率最高诈闺,30歲左右的人違約率最低。貸款用于家庭消費和教育的貸款人铃芦,其貸款違約率低雅镊;聲明月收入超過3萬的人比聲明月收入低于1萬5千的人貸款違約率高;貸款次數(shù)多的人刃滓,其貸款違約率低于第一次貸款的人仁烹。
經常不交公共事業(yè)費和物業(yè)費的人,其貸款違約率較高咧虎。經常換工作卓缰,收入不穩(wěn)定的人貸款違約率較高。經常參加社會公益活動的人砰诵,成為各種組織會員的人征唬,其貸款違約率低。經常更換手機號碼的人貸款違約率比一直使用一個電話號碼的人高很多茁彭。
午夜經常上網总寒,很晚發(fā)微博,生活不規(guī)律尉间,經常在各個城市跑的申請人偿乖,其帶貸款違約率比其他人高30%≌艹埃刻意隱瞞自己過去經歷和聯(lián)系方式贪薪,填寫簡單信息的人,比信息填寫豐富的人違約概率高20%眠副。借款時間長的人比借款時間短短人画切,逾期和違約概率高20%左右。擁有汽車的貸款人比沒有汽車的貸款人囱怕,貸款違約率低10%左右霍弹。
九、利用司法信息評估風險
涉毒涉賭以及涉嫌治安處罰的人娃弓,其信用情況不是太好典格,特別是涉賭和涉毒人員,這些人是高風險人群台丛,一旦獲得貸款耍缴,其貸款用途不可控,貸款有可能不會得到償還挽霉。
尋找這些涉毒涉賭的嫌疑人防嗡,可以利用當?shù)氐墓矓?shù)據,但是難度較大侠坎。也可以采用移動設備的位置信息來進行一定程度的識別蚁趁。如果設備經常在半夜出現(xiàn)在賭博場所或賭博區(qū)域例如澳門,其申請人涉賭的風險就較高实胸。另外中國有些特定的地區(qū)他嫡,當?shù)氐挠幸徊糠秩巳簭氖律尜€或涉賭行業(yè),一旦申請人填寫的居住地址或者移動設備位置信息涉及這些區(qū)域庐完,也要引起重視涮瞻。涉賭和涉毒的人員工作一般也不太穩(wěn)定或者沒有固定工作收入,如果申請人經常換工作或者經常在某一個階段沒有收入假褪,這種情況需要引起重視署咽。涉賭和涉毒的人活動規(guī)律比較特殊,經常半夜在外面活動生音,另外也經常住本地賓館宁否,這些信息都可以參考移動大數(shù)據進行識別。
總之缀遍,互聯(lián)網金融的大數(shù)據風控采用了用戶社會行為和社會屬性數(shù)據慕匠,在一定程度上補充了傳統(tǒng)風控數(shù)據維度不足的缺點,能夠更加全面識別出欺詐客戶域醇,評價客戶的風險水平台谊∪叵保互聯(lián)網金融企業(yè)通過分析申請人的社會行為數(shù)據來控制信用風險,將資金借給合格貸款人锅铅,保證資金的安全酪呻。
(源自:零壹財經)