現(xiàn)在負(fù)責(zé)一款風(fēng)控產(chǎn)品的開(kāi)發(fā)弟胀,想跟大家聊一下關(guān)于大數(shù)據(jù)風(fēng)控的話題,下面是我整理的一些材料孵户,歡迎討論...
什么是大數(shù)據(jù)風(fēng)控夏哭?
簡(jiǎn)單來(lái)說(shuō),就是在互聯(lián)網(wǎng)時(shí)代何址,人們大量的信息都被數(shù)字信息記錄了下來(lái),形成一個(gè)龐大的數(shù)據(jù)庫(kù),通過(guò)一些技術(shù)手段可以將傳統(tǒng)金融風(fēng)控所需要的信息提取出來(lái)项钮,通過(guò)機(jī)器的大規(guī)模數(shù)據(jù)運(yùn)算希停,完成大量用戶的貸款申請(qǐng)審核工作,提升工作效率亚隙。同時(shí)也可以依據(jù)這些數(shù)據(jù)及網(wǎng)上驗(yàn)證身份主體的手段违崇,建立一套針對(duì)互聯(lián)網(wǎng)人群的小額貸款風(fēng)控體系,最近炒的比較熱的大數(shù)據(jù)風(fēng)控渣淳,主要是通過(guò)“數(shù)據(jù)庫(kù)”做好反欺詐入愧、身份核實(shí)嗤谚、失聯(lián)修復(fù)、用戶資質(zhì)授信旁赊、還款意愿評(píng)估渗钉、還款能力評(píng)估及穩(wěn)定性評(píng)估等,決定是否放貸以及放貸額度声离、貸款利率瘫怜。
數(shù)據(jù)來(lái)源
對(duì)于大數(shù)據(jù)風(fēng)控業(yè)務(wù)而言鲸湃,數(shù)據(jù)來(lái)源主要包括幾部分:
一是用戶申請(qǐng)時(shí)提交的數(shù)據(jù)信息子寓,如年齡笋除、性別垃它、籍貫、收入狀況等国拇,這些數(shù)據(jù)可以了解用戶的基本情況酱吝,驗(yàn)證用戶的身份;
二是用戶在使用過(guò)程中產(chǎn)生的行為數(shù)據(jù)忆嗜,包括資料的更改崎岂、選填資料的順序该镣、申請(qǐng)中使用的設(shè)備等,可以通過(guò)用戶的行為來(lái)進(jìn)行特征挖掘省艳;
三是用戶在平臺(tái)上累積的交易數(shù)據(jù)嫁审,如果公司運(yùn)營(yíng)比較久的話,可以累積比較多的用戶借款相關(guān)數(shù)據(jù)辐烂,這類數(shù)據(jù)對(duì)于判斷用戶信用會(huì)有很高的價(jià)值纠修;
四是第三方數(shù)據(jù)厂僧,包括來(lái)自政府、公用事業(yè)辰妙、銀行、運(yùn)營(yíng)商等機(jī)構(gòu)的數(shù)據(jù)蛙婴,以及用戶在電商尔破、社交網(wǎng)絡(luò)呆瞻、網(wǎng)絡(luò)新聞等互聯(lián)網(wǎng)應(yīng)用上留存的數(shù)據(jù)径玖。這類數(shù)據(jù)可以從多角度展示用戶的特征梳星,利用這些數(shù)據(jù)進(jìn)行建模分析,可以找出不同特征與信用水平之間的相關(guān)性前域。
建模分析
大數(shù)據(jù)風(fēng)控模型構(gòu)建的兩個(gè)必要步驟韵吨,一是發(fā)現(xiàn)不同特征與違約之間是否有相關(guān)性归粉,二是為不同的特征賦予權(quán)重或違約概率,以確定擁有多項(xiàng)特征的用戶的信用狀況届榄,決定是否提供金融服務(wù)倔喂、具體的額度以及利率水平席噩。
建模的技術(shù)主要包括logistic回歸、決策樹(shù)鲁捏、普通線性回歸、分層分析假丧、聚類分析动羽、時(shí)間序列等機(jī)器學(xué)習(xí)算法,隨著人工智能技術(shù)的進(jìn)步渴邦,神經(jīng)網(wǎng)絡(luò)谋梭、強(qiáng)化學(xué)習(xí)等前沿的算法也已經(jīng)運(yùn)用到大數(shù)據(jù)建模過(guò)程中倦青。
模型開(kāi)發(fā)出來(lái)后产镐,應(yīng)用到具體的信貸等金融活動(dòng)中,等若干個(gè)放款周期結(jié)束后丑掺,會(huì)有結(jié)果數(shù)據(jù)出來(lái)述雾,這時(shí)候需要依據(jù)這些運(yùn)營(yíng)數(shù)據(jù)對(duì)模型進(jìn)行修正玻孟,經(jīng)過(guò)一次次的迭代菇肃,模型的有效性、實(shí)用性會(huì)逐步提升取募。
例如琐谤,一家企業(yè)完成了100萬(wàn)單的信貸記錄,這就意味著在貸款陸續(xù)到期后玩敏,其大數(shù)據(jù)風(fēng)控體系將收獲100萬(wàn)的數(shù)據(jù)樣本斗忌,這些數(shù)據(jù)樣本與用戶信用高度相關(guān),具有很高的價(jià)值旺聚,使用這些數(shù)據(jù)對(duì)風(fēng)控模型進(jìn)行進(jìn)一步的優(yōu)化织阳,可以提升風(fēng)控的有效性。由此可見(jiàn)砰粹,大數(shù)據(jù)風(fēng)控需要與具體業(yè)務(wù)緊密結(jié)合,不斷“學(xué)習(xí)”,才能夠穩(wěn)定弄痹、可持續(xù)的升級(jí)饭入,對(duì)業(yè)務(wù)有進(jìn)一步的指導(dǎo)意義。
總體來(lái)說(shuō)肛真,目前大數(shù)據(jù)風(fēng)控還在發(fā)展初期谐丢,未來(lái)行業(yè)一個(gè)可能的演化路徑是:一些擁有數(shù)據(jù)資源和技術(shù)算法優(yōu)勢(shì)的企業(yè)在市場(chǎng)規(guī)模上具備了一定優(yōu)勢(shì)后,擁有更多的數(shù)據(jù)資源來(lái)支持模型的優(yōu)化迭代蚓让,強(qiáng)化其技術(shù)優(yōu)勢(shì)乾忱,從而可以在控制風(fēng)險(xiǎn)的基礎(chǔ)上提高貸款申請(qǐng)的通過(guò)率,使自己技術(shù)支持下的交易規(guī)模越做越大历极。在不考慮黑天鵝事件的前提下窄瘟,行業(yè)可能出現(xiàn)強(qiáng)者恒強(qiáng)的馬太效應(yīng)。
就我所見(jiàn)到的數(shù)據(jù)分析維度比較全面的公司是蝙蝠征信
http://www.bianfuzhengxin.com/dataCenter/1.html
大數(shù)據(jù)風(fēng)控企業(yè)
就線上小額貸款來(lái)說(shuō)最關(guān)鍵的還是數(shù)據(jù)來(lái)源和數(shù)據(jù)的真實(shí)性趟卸,風(fēng)控模型的構(gòu)建和優(yōu)化都是建立在前期不斷的試錯(cuò)上蹄葱,而這確是需要很大的資金投入。技術(shù)都是在數(shù)據(jù)基礎(chǔ)上的應(yīng)用衰腌,只有構(gòu)建好底層數(shù)據(jù),技術(shù)才能發(fā)揮優(yōu)勢(shì)觅赊。