j.zhang xc.li zl.xv
指導(dǎo)老師 sc.jiang
摘要:近年來P2P網(wǎng)貸成為了一種新的理財方式锨亏,但是不少P2P網(wǎng)貸平臺只是曇花一現(xiàn)。目前認(rèn)為可持續(xù)的P2P網(wǎng)貸的模式一種是基于大數(shù)據(jù)的P2P網(wǎng)貸平臺模式,一種是傳統(tǒng)的抵押貸款加上互聯(lián)網(wǎng)的模式要出。
本文希望試圖通過研究P2P和大數(shù)據(jù)的結(jié)合巢价,探討大數(shù)據(jù)在P2P信用評估上的作用,提出我們自己對于大數(shù)據(jù)應(yīng)用的研究設(shè)想立叛,結(jié)合具體案例為大數(shù)據(jù)應(yīng)用于P2P網(wǎng)絡(luò)借貸信用評估作出分析负敏,最后分析大數(shù)據(jù)應(yīng)用于P2P信用評估的優(yōu)勢與困境,為P2P這一新興產(chǎn)業(yè)的可持續(xù)發(fā)展模式作出研究秘蛇。具體來說其做,本文主要,對于拍拍貸赁还,阿里小貸兩家典型的P2P網(wǎng)絡(luò)借貸平臺進(jìn)行分析妖泄,進(jìn)而采用了數(shù)據(jù)分析,統(tǒng)計模型中較為常用的邏輯回歸來對科學(xué)的信用評估模型提出設(shè)想艘策。
關(guān)鍵字:P2P網(wǎng)絡(luò)借貸平臺,大數(shù)據(jù)蹈胡,信用評估模型,風(fēng)險管理
一?背景介紹
1.1大數(shù)據(jù)是什么朋蔫?
大數(shù)據(jù)主要指以云計算為數(shù)據(jù)處理技術(shù)平臺的新的數(shù)據(jù)處理方法罚渐。概念最早是由咨詢公司麥肯錫提出。其主要有四“V”特征 驯妄,即 :Volume(特大的數(shù)據(jù)量)荷并、Variety(特別多種多樣的數(shù)據(jù))、Veracity(數(shù)據(jù)真實性高且有價值)青扔、Velocity(輸入和處理速度快)源织。大數(shù)據(jù)技術(shù)核心在數(shù)據(jù)挖掘方面,即利用分類赎懦、關(guān)聯(lián)規(guī)則雀鹃、復(fù)雜數(shù)據(jù)類型挖掘(文本、網(wǎng)絡(luò)励两、圖形圖像黎茎、視頻、音頻等)等技術(shù)進(jìn)行挖掘当悔。最后傅瞻,通過預(yù)測模型踢代、建模仿真等進(jìn)行預(yù)測,并通過云計算嗅骄、關(guān)系圖胳挎、標(biāo)簽云等進(jìn)行結(jié)果呈現(xiàn),實現(xiàn)堆積數(shù)據(jù)的再挖掘溺森、再利用慕爬。傳統(tǒng)數(shù)據(jù)多事基于結(jié)構(gòu)性的數(shù)據(jù),有固定格式屏积,表格可以記錄的医窿,而大數(shù)據(jù)的特點在于同時包括結(jié)構(gòu)性與非結(jié)構(gòu)性的數(shù)據(jù),包括圖片炊林,音頻視頻網(wǎng)絡(luò)日志等姥卢,數(shù)據(jù)的量非常大;大數(shù)據(jù)所分析的是事物間的相關(guān)關(guān)系渣聚,而非因果關(guān)系独榴,重點在于弄清是什么,而不是為什么奕枝。大數(shù)據(jù)為了數(shù)據(jù)的全面性棺榔,犧牲了數(shù)據(jù)的精確性,準(zhǔn)確性倍权。對于數(shù)據(jù)的處理也從以計算為中心掷豺,轉(zhuǎn)變?yōu)橐蕴幚頌橹行摹?/p>
麥肯錫在《Big data: The next frontier for innovation, competition, and productivity》列出了各個行業(yè)利用大數(shù)據(jù)價值的難易度以及發(fā)展?jié)摿Α?/p>
圖1各個行業(yè)利用大數(shù)據(jù)價值的難易度以及發(fā)展?jié)摿?/b>
?
麥肯錫也列出了大數(shù)據(jù)時代里七大行業(yè)潛在的經(jīng)濟價值捞烟,自上而下分別是教育薄声,運輸,消費品题画、電力默辨、石油與天然氣、醫(yī)療護(hù)理苍息、消費金融缩幸。
1.2P2P網(wǎng)絡(luò)借貸是什么?
P2P是peer-to-peer的縮寫竞思,網(wǎng)絡(luò)借貸指的是借貸過程全部通過網(wǎng)絡(luò)實現(xiàn)表谊,它是隨著互聯(lián)網(wǎng)的發(fā)展和民間借貸的興起而發(fā)展起來的一種新的金融模式。P2P網(wǎng)絡(luò)借貸平臺在英美等發(fā)達(dá)國家發(fā)展已相對完善盖喷,這種新型的理財模式已逐漸被身處網(wǎng)絡(luò)時代的大眾所接受爆办。
發(fā)展至今由P2P的概念已經(jīng)衍生出了很多模式。中國的網(wǎng)絡(luò)借貸平臺已經(jīng)超過2000家课梳,平臺的模式各有不同距辆,歸納起來主要有以下四類:
1.2.1擔(dān)保機構(gòu)擔(dān)保交易模式
這也是最安全的P2P模式余佃。此類平臺作為中介,平臺不吸儲跨算,不放貸爆土,只提供金融信息服務(wù),由合作的小貸公司和擔(dān)保機構(gòu)提供雙重?fù)?dān)保诸蚕。此類平臺的交易模式多為“1對多”步势,即一筆借款需求由多個投資人投資。由國內(nèi)大型擔(dān)保機構(gòu)聯(lián)合擔(dān)保背犯,如果遇到壞賬立润,擔(dān)保機構(gòu)會在第二日把本金和利息及時打到投資人賬戶,所以是最安全的一種模式媳板。
1.2.2P2P平臺下的債權(quán)合同轉(zhuǎn)讓模式
可以稱之為“多對多”模式桑腮,是一種非典型的P2P的線下模式。借款需求和投資都是打散組合的蛉幸,自己作為最大債權(quán)人將資金出借給借款人破讨,然后獲取債權(quán)對其分割,通過債權(quán)轉(zhuǎn)讓形式將債權(quán)轉(zhuǎn)移給其他投資人奕纫,獲得借貸資金提陶。
對外放貸金額必須大于等于轉(zhuǎn)讓債權(quán),如果放貸金額實際小于轉(zhuǎn)讓債權(quán)匹层,根據(jù)《關(guān)于進(jìn)一步打擊非法集資等活動的通知》隙笆,屬于非法集資范疇。
1.2.3大型金融集團(tuán)推出的互聯(lián)網(wǎng)服務(wù)平臺
此類平臺是由傳統(tǒng)金融行業(yè)向互聯(lián)網(wǎng)布局升筏,因此在業(yè)務(wù)模式上金融色彩更濃撑柔。
1.2.4以交易參數(shù)為基點,結(jié)合O2O的綜合交易模式
這種小貸模式創(chuàng)建的P2P小額貸款業(yè)務(wù)憑借其客戶資源您访、電商交易數(shù)據(jù)及產(chǎn)品結(jié)構(gòu)占得優(yōu)勢铅忿,其線下成立的小額貸款公司對其平臺客戶進(jìn)行服務(wù)。線下商務(wù)的機會與互聯(lián)網(wǎng)結(jié)合在了一起灵汪,讓互聯(lián)網(wǎng)成為線下交易的前臺檀训。
1.3 p2p和傳統(tǒng)銀行的區(qū)別
1.3.1集資能力強,可提供的貸款金額比傳統(tǒng)銀行充裕享言。
由于p2p平臺的利率高于銀行峻凫,更多人會把錢放在平臺上。
1.3.2手續(xù)簡便
與傳統(tǒng)的貸款眾多繁瑣的程序相比較览露,P2P網(wǎng)貸擁有非常簡潔的操作程序荧琼。目前的網(wǎng)貸趨于小額化,有些無需貸款者提供抵押,更加簡化了貸款的手續(xù)铭腕。
1.3.3形式靈活
P2P網(wǎng)貸形式非常靈活银择。銀行理財產(chǎn)品都是一次性本息付清,資金流動性不夠累舷,而P2P網(wǎng)貸平臺推出的產(chǎn)品通常都是按日計息浩考,隨時換回,資金比較活絡(luò)被盈。
1.3.4門檻低
P2P手續(xù)費比銀行理財產(chǎn)品低析孽,起投門檻也比較低,甚至推出了1元起投只怎,吸引更多的出資者袜瞬。
1.3.5資金流向明確
很多銀行的產(chǎn)品經(jīng)理和出資者都不清楚自己資金的流向、用途身堡、收益邓尤、風(fēng)險。而很多P2P網(wǎng)貸平臺都公示了資金用途贴谎,包含借貸給誰汞扎,借款方的還款時間,等等擅这。P2P網(wǎng)貸比銀行清楚很多澈魄,讓出資者定心了很多。
根據(jù)論文:p2p借貸平臺可以通過借款人和貸款人之間的社交互動來減小壞賬的風(fēng)險仲翎,投資人相較銀行更加風(fēng)險偏好痹扇。
研究指出在名義利率為8%時,有最大的內(nèi)部收益率溯香。
盈利點并不是吸引高質(zhì)量的貸款方鲫构,而是鼓勵投資低質(zhì)量的貸款項目。
?
1.4大數(shù)據(jù)如何分析數(shù)據(jù)
當(dāng)前逐哈,大數(shù)據(jù)處理方式可分為兩大類芬迄,數(shù)據(jù)批量處理和數(shù)據(jù)流處理问顷。前者采用先存儲后處理方式昂秃,不追求數(shù)據(jù)的時效性。后者對實時性要求相對高且處理速度快的需求杜窄,采用直接處理方式肠骆,是一種“化整為零”的策略。
對于P2P網(wǎng)貸平臺信用評估而言塞耕,需要的更多的是數(shù)據(jù)的批處理蚀腿。所以我們著重介紹數(shù)據(jù)的批處理過程。
圖2大數(shù)據(jù)的處理流程
主要過程是獲取數(shù)據(jù)源,進(jìn)行數(shù)據(jù)抽象和整合莉钙,數(shù)據(jù)分析廓脆,數(shù)據(jù)解讀,用戶使用
其中數(shù)據(jù)的抽取與集成特點為先有數(shù)據(jù)后有模式磁玉,而且模式在不斷演進(jìn)中停忿。批處理的核心在于數(shù)據(jù)分析。其特點為數(shù)據(jù)必須進(jìn)行預(yù)處理以排除干擾蚊伞,算法需要調(diào)整席赂,結(jié)果衡量困難(因為數(shù)據(jù)龐雜)。最后的數(shù)據(jù)解釋需要把結(jié)果變成可視化形式时迫。
二?大數(shù)據(jù)應(yīng)用于P2P網(wǎng)貸的研究設(shè)想
2.1 P2P平臺應(yīng)用大數(shù)據(jù)的優(yōu)點
對于P2P網(wǎng)絡(luò)貸款平臺而言颅停,最大的目標(biāo)客戶群體是那些小額的,表面上看信用度較低掠拳,被傳統(tǒng)的金融行業(yè)拒之門外的資金需求者癞揉。例如美國的finance,其客戶多是根據(jù)傳統(tǒng)的信用評分模型被銀行業(yè)拒絕貸款請求的群體溺欧,因此基于傳統(tǒng)的信用評估體系烧董,這部分客戶群體很難得到授信。為了在這個基礎(chǔ)上實現(xiàn)創(chuàng)新胧奔,爭取被傳統(tǒng)銀行業(yè)放棄的市場逊移、降低違約風(fēng)險,finance充分利用大數(shù)據(jù)時代所的便利龙填,通過傳統(tǒng)行業(yè)以及網(wǎng)絡(luò)社交胳泉、電商等平臺獲取海量的客戶數(shù)據(jù),利用大數(shù)據(jù)分析工具對數(shù)據(jù)處理岩遗,分析扇商,得到更為豐富也更為準(zhǔn)確的信用信息。實現(xiàn)了對客戶篩選宿礁,信用打分的過程案铺。對于小額資金的委托人來說,獲取這些數(shù)據(jù)的時間成本和交易費用過高梆靖,對比小額貸款所帶來的收益控汉,可能會得不償失。委托人很難對代理人的信用等級進(jìn)行打分返吻,將損失降到最低姑子,因此通過P2Pp平臺方的力量實現(xiàn)對這些數(shù)據(jù)的收集,分析测僵,從而降低成本的需求巨大街佑。
另一方面,在委托人將資金借予客戶后,客戶對于所得資金的使用方式有多種選沐旨,委托人無法確保借出的資金用于代客戶所承諾的事項森逮,當(dāng)客戶將資金用于高風(fēng)險的行業(yè)時,委托人也面臨著很高的無法收回本金的風(fēng)險磁携。如何解決信息不對稱問題吊宋,對于P2P網(wǎng)絡(luò)貸款平臺而言,提供平臺并向委托人提供信息服務(wù)颜武,收取費用是一個很好的選擇璃搜。P2P網(wǎng)絡(luò)貸款平臺根據(jù)自己所掌握的資源獲取代理人的大數(shù)據(jù),利用信用評分模型進(jìn)行評估打分鳞上。特別是當(dāng)平臺規(guī)模達(dá)到一定程度以后这吻,信息的二次利用會為平臺降低信息搜集成本,帶來巨大利潤篙议。
?
2.2大數(shù)據(jù)分析方法
目前所使用的個人信用評分模型主要包括5C模型唾糯,也即character(借款人品德)、capacity(經(jīng)營能力)鬼贱、capital(資本)移怯、collateral(經(jīng)營抵押)、和condition(經(jīng)營環(huán)境)这难。
(1)character(品德)舟误,也即客戶按期履行還款義務(wù),承擔(dān)相應(yīng)的責(zé)任的可能性姻乓。是評估客戶信用的首要指標(biāo)嵌溢,道德品質(zhì)主要評估的是客戶的還款意愿,以及在不能如期履約時的承擔(dān)責(zé)任的可能蹋岩。這決定了委托人能否及時收回本金并獲取收益赖草。
(2)capacity(能力),也即償債能力剪个。通過考核客戶的資產(chǎn)負(fù)債比例秧骑,結(jié)合客戶的流動資產(chǎn)數(shù)量和質(zhì)量做出判斷】勰遥客戶過往的償債記錄也能作為償債能力的參考乎折。
(3)capital(資產(chǎn)),這部分考核的是用戶的財務(wù)實力與財務(wù)狀況如暖,主要針對客戶在償還債務(wù)時可信賴的財務(wù)背景笆檀,是信用評分模型里的重點。
(4)collateral(經(jīng)營抵押)盒至。經(jīng)營抵押也即在客戶不能按時還款付息的情況下,可以通過抵押資產(chǎn)來償還債務(wù),這對信用歷史較差枷遂,或者是首次通過P2P網(wǎng)貸平臺進(jìn)行貸款的客戶而言格外重要樱衷。
(5)condition(經(jīng)營環(huán)境)也即可能會導(dǎo)致客戶產(chǎn)生較大違約風(fēng)險的經(jīng)濟環(huán)境,包括客戶個人的經(jīng)濟環(huán)境與整體的宏觀經(jīng)濟環(huán)境酒唉。例如客戶個人的財務(wù)問題矩桂,投資決策失誤等導(dǎo)致其在一定時間內(nèi)的流動性出現(xiàn)重大問題,以及在宏觀經(jīng)濟出現(xiàn)危機時痪伦,客戶所在的行業(yè)發(fā)展低迷侄榴,可能導(dǎo)致在短時間內(nèi)無法收回成本,進(jìn)而有較高的違約風(fēng)險网沾。
圖3 5C分析法
對5C模型癞蚕,也有人創(chuàng)新性的提出了5W模型:who(借款人)、how(通過何種方式還款)辉哥、why(為什么要借款)桦山、what(抵押擔(dān)保物是什么)、when(何時還款)這五個維度醋旦,綜合評定客戶的信用等級恒水。同時還有5P模型等。無論是何種信用評分的模型饲齐,都是通過大數(shù)據(jù)分析钉凌。
2.3大數(shù)據(jù)獲取
在信息爆炸的今天,數(shù)據(jù)的獲取非常容易捂人。個體的一言一行都會被電子設(shè)備記載下來甩骏,轉(zhuǎn)化成數(shù)據(jù)。傳統(tǒng)的包括銀行會記錄下客戶的資金流水先慷,從存取記錄饮笛,到借貸余額,還款情況论熙;商店記錄下與顧客交易的收付情況福青,學(xué)校登記學(xué)生在校期間的獎懲信息,企業(yè)記錄員工的工作情況等脓诡。新興的如網(wǎng)絡(luò)電商會記載顧客消費記錄无午,甚至是瀏覽記錄;虛擬社交平臺可以記載用戶的每天的日匙Q瑁活動宪迟,朋友圈子的大小,日活躍度等信息交惯;可穿戴設(shè)備無時無刻的測度和收集使用者的活動數(shù)據(jù)次泽,現(xiàn)代社會無時無刻都在收集數(shù)據(jù)穿仪,處理數(shù)據(jù)。
按照數(shù)據(jù)的內(nèi)容劃分意荤,大數(shù)據(jù)的來源包括三大類:(1)屬性數(shù)據(jù)啊片。包括年齡、職業(yè)玖像、收入狀況紫谷、家庭住址等;(2)征信體系留存的信息捐寥。征信體系又包括三個方面笤昨,金融征信,主要通過金融行業(yè)主管部門主導(dǎo)建設(shè)握恳;商業(yè)征信瞒窒,行業(yè)協(xié)會及其會員主導(dǎo)進(jìn)行建設(shè),主要收集企業(yè)及個人的商業(yè)信息睡互,來應(yīng)對交易風(fēng)險和管理風(fēng)險根竿;行政征信。行政征信的主導(dǎo)部門為政府的行政機構(gòu)就珠,同樣以企業(yè)和個人為主要的征信對象寇壳,用戶群為政府本身,通過行政征信來實現(xiàn)信用懲戒與預(yù)警監(jiān)管的統(tǒng)一管理妻怎。(3)個體的網(wǎng)絡(luò)活動壳炎,包括網(wǎng)絡(luò)社交平臺的活動產(chǎn)生的信息,諸如朋友圈的活躍度逼侦,親密朋友個數(shù)匿辩,個人偏好等;還有上網(wǎng)記錄榛丢,在電商平臺的購物铲球,瀏覽記錄,每個月網(wǎng)購消費次數(shù)晰赞,消費金額等稼病。
?
2.4大數(shù)據(jù)的處理
在收集到數(shù)據(jù)后,開始對數(shù)據(jù)進(jìn)行處理掖鱼。數(shù)據(jù)處理分為數(shù)據(jù)準(zhǔn)備---數(shù)據(jù)清洗和匯總--變量篩選---評分模型開發(fā)與驗證--評分模型的監(jiān)控與再開發(fā)然走,如圖2。
圖4大數(shù)據(jù)的處理
?
?
?
在應(yīng)用大數(shù)據(jù)之前戏挡,對關(guān)鍵名詞進(jìn)行定義芍瑞。信用評分模型的分析結(jié)果表現(xiàn)為兩種結(jié)果,可以貸款與不可貸款褐墅。對應(yīng)著好賬戶與壞的賬戶拆檬。歷史經(jīng)驗表明洪己,一般而言,超過表現(xiàn)窗口秩仆,逾越在30天以上的可以做違約處理定義為壞賬戶码泛,1―30天的為待定猾封,其余為好賬戶澄耍。
數(shù)據(jù)準(zhǔn)備也即前面提到的數(shù)據(jù)的收集,包括來自于三大征信體系(金融征信晌缘,商業(yè)征信齐莲,行政征信;及客戶的互聯(lián)網(wǎng)數(shù)據(jù)磷箕,包括電商平臺的瀏覽和消費記錄选酗,上網(wǎng)記錄,社交平臺數(shù)據(jù)岳枷,親密朋友數(shù)量芒填,朋友圈日活躍度等)
然后是數(shù)據(jù)的清洗與匯總。數(shù)據(jù)的清洗過程可以借助于文本識別和圖像識別等工具空繁。對海量的數(shù)據(jù)進(jìn)行篩選殿衰,留下對信用評分有關(guān)的信息,同時將繁雜的非結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)為可供分析的數(shù)據(jù)盛泡,例如將上網(wǎng)記錄轉(zhuǎn)變?yōu)樯暇W(wǎng)時長闷祥,瀏覽商品的次數(shù),瀏覽商品的價格傲诵,偏好凯砍。對部分虛擬變量,如年齡拴竹、性別等采取賦值的辦法悟衩。當(dāng)樣本數(shù)量較大的時候,還可以對數(shù)據(jù)進(jìn)行細(xì)分分析。將比較大的樣本分為若干個性質(zhì)相同的小組械姻,對每個不同的組別設(shè)計評分工具和業(yè)務(wù)策略亡问,最終得到最有效的信用評分模型。當(dāng)然钳榨,在樣本數(shù)據(jù)較少的情況下可以不做要求,直接在總體樣本上進(jìn)行數(shù)據(jù)分析和模型建立纽门。
其次是變量篩選薛耻。通過各種渠道篩選到的變量指標(biāo)有數(shù)百個,還包括各種非結(jié)構(gòu)的數(shù)據(jù)赏陵。所以需要對變量進(jìn)行篩選饼齿∷茄考慮到可能存在的數(shù)據(jù)的殘缺程度,很多指標(biāo)只是部分客戶群體具有缕溉,另外一部分沒有考传。當(dāng)數(shù)據(jù)殘缺率過高時,就不適合作為模型參考變量证鸥;另外一種解決方式是對殘缺值賦零僚楞,根據(jù)指標(biāo)值的重要程度而確定。同時枉层,在篩選數(shù)據(jù)的時候泉褐,為了防止異常值對模型結(jié)果產(chǎn)生較大的影響,設(shè)置變量值的上限與下限鸟蜡,也可以采用取對數(shù)等于因變量關(guān)系較為密切的方法對異常值進(jìn)行處理膜赃。
在進(jìn)行模型分析之前,還需做穩(wěn)定性分析揉忘,信息值分析跳座,相關(guān)關(guān)系及逐步回歸判別分析。穩(wěn)定性分析采用PSI(Population Stability Index)法來衡量泣矛,通過穩(wěn)定性分析疲眷,可以驗證模型在將來的業(yè)務(wù)中也會有穩(wěn)定的而表現(xiàn);信息值分析是主要考核變量的好壞乳蓄,信息值越高的變量咪橙,對模型的說明長度越高;還有相關(guān)關(guān)系分析虚倒。相關(guān)關(guān)系分析包括單變量分析美侦,雙變量分析,及多變量分析等魂奥,主要是通過考核變量間相關(guān)關(guān)系的程度菠剩。逐步回歸判別分析,這部分主要通過stata數(shù)據(jù)分析軟件耻煤,通過逐一引入模型變量的方式具壮,當(dāng)加入下一個變量的時候,對模型進(jìn)行重復(fù)評估哈蝇,保留那些對模型顯著性有明顯改善的數(shù)據(jù)棺妓,去除對模型顯著程度無明顯改善的變量。
2.5模型分析
根據(jù)數(shù)據(jù)處理保存下來的指標(biāo)炮赦,選用logistic回歸(或者神經(jīng)網(wǎng)絡(luò)怜跑,線性回歸等方法)建立模型,通過軟件得到指標(biāo)值和參數(shù)值等吠勘,進(jìn)而做信用評性芬。前面提到過峡眶,信用評分模型的結(jié)果為一個二元變量,好賬戶或壞賬戶植锉,所以一般模型回歸采用logistic回歸的方法辫樱。假定經(jīng)過前面的數(shù)據(jù)處理保存下來的指標(biāo)變量個數(shù)為N個,對應(yīng)的指標(biāo)變量為X(X1俊庇,X2狮暑,X3…..,Xn-1,Xn),條件概率的公式為P(Z=1|X)=P為根據(jù)觀測變量的分析結(jié)果得到的好賬戶的概率,logistic模型可表示為P(Z=1|X)=.(f(x)=β0+)logistic函數(shù)模型為如下圖:
圖5邏輯函數(shù)
?
三?案例分析
3.1以拍拍貸為例的大數(shù)據(jù)應(yīng)用于P2P的個人信用模型分析
以往的對于個人的信用分析主要通過個體狀況分析暇赤,主要包括基本信息(姓名心例、身份證號宵凌、住所等)鞋囊、教育及技能信息(學(xué)歷、資格證書等)瞎惫、收入及資產(chǎn)信息(工資溜腐、房產(chǎn)、汽車等)瓜喇、工作信息(行業(yè)挺益、單位、職位)乘寒、關(guān)系信息(婚姻狀況望众、子女狀況等),以往信用記錄進(jìn)行分析伞辛。存在速度慢烂翰。
國內(nèi)拍拍貸網(wǎng)貸平臺通過搜集整理個人信息,結(jié)合個人的社交信息和網(wǎng)購行為對個人信用進(jìn)行綜合評估并推算其可能違約的成本蚤氏。
其中社交網(wǎng)絡(luò)行為分析是指從高科技的社交軟件如微信甘耿、微博、人人網(wǎng)竿滨、論壇等出發(fā)佳恬,通過記錄好友數(shù)量、粉絲數(shù)量于游、發(fā)帖內(nèi)容等因素對其進(jìn)行信用評估毁葱。評估體系認(rèn)為在社交網(wǎng)絡(luò)越活躍、朋友越多的人贰剥,違約風(fēng)險越低倾剿。如今人們對這些網(wǎng)絡(luò)社交軟件的依賴高于電話短信,導(dǎo)致越來越多的社交網(wǎng)絡(luò)信息可以被采集并利用起來對一個人的信用進(jìn)行評估鸠澈,使P2P信用評估體系愈發(fā)完善柱告、準(zhǔn)確截驮。
網(wǎng)絡(luò)購物行為是征信評估中唯一一個把行為與金錢密切相連的重要因素。通過分析個人購物行為及電子賬戶資金流水际度,來了解個人的消費能力及資金狀況葵袭,并在此基礎(chǔ)上進(jìn)行信用評估。拍拍貸以主打網(wǎng)商標(biāo)的和網(wǎng)購標(biāo)的來間接搜集網(wǎng)絡(luò)購物信息乖菱,其平臺約50%的借款人為電商用戶坡锡,以天貓用戶居多。
?
?
?
?
?
?
?
3.2以阿里金融為例的現(xiàn)行中小企業(yè)信用模型分析
首先根據(jù)樣本數(shù)量窒所,采用隨機抽樣或者跨時間驗證樣本確立樣本鹉勒,定義目標(biāo)變量。通過對歷史時段值的統(tǒng)計匯總吵取,如過去6個月的平均值禽额,極值,次數(shù)皮官,比率等生成模型變量
主要通過對于變量的上下限的處理,變量缺失值的處理,以及對變量轉(zhuǎn)換和變形進(jìn)行模型變量處理脯倒。
其次模型開發(fā)的關(guān)鍵是變量選擇和邏輯回歸運算。通過單變量捺氢、雙變量分析初步篩選藻丢,再根據(jù)穩(wěn)定性、信息值摄乒、相關(guān)性等指標(biāo)作篩選悠反,使用步進(jìn)判別的方法保留對模型影響最顯著的變量。對選擇的變量用邏輯回歸作評分排序馍佑,用K-S檢驗校驗?zāi)P偷呐袆e能力并檢驗?zāi)P偷姆€(wěn)定性斋否。
其中樣本分為訓(xùn)練樣本和預(yù)留樣本,在數(shù)據(jù)足夠充分的情況下還應(yīng)準(zhǔn)備跨時間驗證的樣本挤茄。訓(xùn)練樣本用于模型變量的選擇如叼,及模型開發(fā);預(yù)留樣本用于模型的預(yù)測穷劈;跨時間樣本用于檢驗?zāi)P偷姆€(wěn)定性笼恰,考核模型在跨時間的情況下判斷效果的準(zhǔn)確程度。如果模型在不同時期的判斷效果有顯著差別歇终,說明模型不適用不同時間的樣本社证,需要進(jìn)行改進(jìn)。
圖6穩(wěn)定性分析
?
如圖评凝,為跨時間樣本的點估計追葡,可以看出兩者較為一致,模型具有很強的穩(wěn)定性,能夠長期使用宜肉。除此之外還有跨時間驗證增益表匀钧,增益圖等可以輔助驗證模型的穩(wěn)定性。
最后建立的模型可以用來指定審批準(zhǔn)入策略谬返,額度授信策略之斯,營銷利率定價策略,催收策略調(diào)整幫助增加風(fēng)控管理遣铝。模型還可以控制風(fēng)險同時提高準(zhǔn)入數(shù)量佑刷,更準(zhǔn)確地授信,控制損失提高收益酿炸,提高催收效率瘫絮。
?
?
四?大數(shù)據(jù)應(yīng)用于P2P的優(yōu)勢和困境
4.1大數(shù)據(jù)應(yīng)用于P2P網(wǎng)貸平臺的優(yōu)勢
傳統(tǒng)的風(fēng)險控制機制已經(jīng)不能滿足P2P網(wǎng)貸平臺的發(fā)展要求,如今數(shù)據(jù)的組成是15%的結(jié)構(gòu)性數(shù)據(jù)和85%的非結(jié)構(gòu)性數(shù)據(jù)可知填硕,傳統(tǒng)的分析只能分析結(jié)構(gòu)性的數(shù)據(jù)麦萤,大量的可以反映借款人的性格,違約風(fēng)險大小的非結(jié)構(gòu)性數(shù)據(jù)被拋棄廷支,所以P2P網(wǎng)貸平臺需要使用大數(shù)據(jù)技術(shù)來對更為廣泛存在的非結(jié)構(gòu)數(shù)據(jù)進(jìn)行分析频鉴。
作為一種新的技術(shù),大數(shù)據(jù)有著非常廣闊的應(yīng)用前景恋拍。在一份由麥肯錫列出的表格中顯示,,大數(shù)據(jù)在美國的七個領(lǐng)域有3.2到5.4萬億美元的潛在的經(jīng)濟價值,光在金融領(lǐng)域就有2100`2800億藕甩,應(yīng)用前景非常好施敢。大數(shù)據(jù)在研究人的行為,從而進(jìn)行風(fēng)控狭莱,節(jié)約企業(yè)成本僵娃,分析宏觀經(jīng)濟運行等諸多領(lǐng)域有著很重大的意義。
圖7大數(shù)據(jù)在7個領(lǐng)域的經(jīng)濟價值
來源:Mckinsey
P2P網(wǎng)絡(luò)借貸作為一個依賴于IT結(jié)技術(shù)的線上金融平臺腋妙,其自身的優(yōu)勢是可以搜集到大量的客戶的互聯(lián)網(wǎng)上的信息默怨,包括社交網(wǎng)絡(luò)上的活動,網(wǎng)絡(luò)交易等等骤素。而大數(shù)據(jù)技術(shù)恰好可以充分利用這部分信息匙睹,發(fā)掘其中的價值。
目前在國外已經(jīng)有很多大數(shù)據(jù)應(yīng)用的成功的典范济竹,大數(shù)據(jù)技術(shù)可以在風(fēng)險控制痕檬,客戶行為研究上承擔(dān)很重要的角色
大數(shù)據(jù)在P2P上的應(yīng)用優(yōu)勢主要有以下幾點:
1.基于大數(shù)據(jù)的風(fēng)險管理轉(zhuǎn)變了借貸模式。
大數(shù)據(jù)推動風(fēng)險管理理念和工具的調(diào)整送浊。傳統(tǒng)風(fēng)險管理理念是通過財務(wù)分析梦谜、可抵押資產(chǎn)或權(quán)證評估借款人風(fēng)險水平。然而大數(shù)據(jù)的出現(xiàn)使得對交易行為的真實性、信用的可信度的分析變得更加重要唁桩,風(fēng)險定價方式轉(zhuǎn)變?yōu)閷崟r的闭树、全方位的、立體的荒澡、動態(tài)的模式.
2.大數(shù)據(jù)提高放貸快捷度蔼啦。
P2P行業(yè)發(fā)展的趨勢是為客戶提供個性化、快速仰猖、準(zhǔn)確捏肢、高效服務(wù)。這些都建立在長期大量的信用和資金流的大數(shù)據(jù)基礎(chǔ)之上饥侵,一方面有利于運用大數(shù)據(jù)金融的企業(yè)快速計算得出信用評分鸵赫。通過網(wǎng)上支付方式,實時根據(jù)貸款需要及信用評分等大數(shù)據(jù)來放出貸款躏升。另一方面辩棒,有利于管理匹配期限,有效地解決資金流動性問題膨疏。
3.大數(shù)據(jù)提高了P2P借貸的利潤率一睁。
資金融通以大數(shù)據(jù)、云計算為基礎(chǔ)佃却,自動計算為主而非人工審批為主的模式降低了貸款審查的邊際成本者吁,大大降低了風(fēng)控成本,在美國的借貸市場中饲帅,LendingClub能夠利用互聯(lián)網(wǎng)技術(shù)把自身平臺成本控制在2.7%复凳,低于銀行6.95%的成本是其核心競爭力所在。利用大數(shù)據(jù)還可以根據(jù)企業(yè)資金需求周期靈活決定貸款期限灶泵。同時育八,依托中小企業(yè)大數(shù)據(jù),整合碎片化的需求和供給赦邻,做出統(tǒng)籌財務(wù)規(guī)劃髓棋,拓展服務(wù)領(lǐng)域,進(jìn)一步拉低了企業(yè)的運營與交易成本惶洲。此外按声,P2P可以根據(jù)客戶背景數(shù)據(jù)分析,模仿Google廣告投放的模式湃鹊,在平臺網(wǎng)站上推出有針對性的廣告儒喊,從而提高主營業(yè)務(wù)外收入。
4.大數(shù)據(jù)提高了P2P行業(yè)的科學(xué)決策和風(fēng)險管理水平币呵。
大數(shù)據(jù)能夠解決信用分配怀愧、風(fēng)險評估侨颈、實施授權(quán)甚至是識別欺詐問題。利用分布式計算做出風(fēng)險定價芯义、風(fēng)險評估模型哈垢,這些模型不僅可以替代風(fēng)險管理、風(fēng)險定價扛拨,甚至可以自動生成保險精算耘分。基于交易借貸行為基礎(chǔ)上的大數(shù)據(jù)也可以實時得出違約率绑警、信用評分等指標(biāo)求泰,有利于金融風(fēng)險控制.
?
4.2大數(shù)據(jù)應(yīng)用于P2P的困境與限制
鄧建鵬,熊明计盒,任一奇在《大數(shù)據(jù)在P2P網(wǎng)貸中的應(yīng)用與困境》中主要認(rèn)為存在網(wǎng)絡(luò)信息難以還原現(xiàn)實信息渴频,金融信用和社會信用的相關(guān)性不確定,缺失閉環(huán)數(shù)據(jù)北启,數(shù)據(jù)的難以流通和大數(shù)據(jù)人才短缺這五點不足卜朗。
除了前人提過的不足,我們認(rèn)為大數(shù)據(jù)應(yīng)用于P2P存在的困境存在以下幾點咕村。
(1)P2P行業(yè)特性導(dǎo)致的困境
P2P的借貸雙方往往一方指的是銀行不愿意或者無法貸款场钉、但卻急需資金的“次級”客戶;另一方指的是缺乏理財渠道的個人投資者。個人即使在現(xiàn)有平臺的幫助下也往往難以辨別這些不優(yōu)質(zhì)的借款方懈涛。Stiglitz和Weiss(1981)預(yù)測道對于傳統(tǒng)貸款逛万,高利率因為低質(zhì)量的借款方可能給貸款方帶來低回報。根據(jù)Prosper肩钠,美國最大的P2P網(wǎng)貸公司的發(fā)現(xiàn)泣港,IRR(內(nèi)部收益率)當(dāng)利率達(dá)到8%以后呈現(xiàn)單調(diào)不遞增函數(shù),利率超過28%后呈現(xiàn)明顯的下降趨勢价匠。
以中國為例,中國2015的P2P平均利率在10%-15%之間浮動呛每,主要還是依靠高利率來吸引投資踩窖,(數(shù)據(jù)來源http://www.p2p001.com/wdzs/wdzs_p2pline.html)其中部分公司,如人人貸采用“風(fēng)險準(zhǔn)備金”等方式為投資人提供保障晨横,利用杠桿管理風(fēng)險洋腮,一定程度上延伸了業(yè)務(wù)流程,帶來更多利潤的同時手形,風(fēng)險也更大啥供。
由于P2P平臺還剛起步,目前無論國內(nèi)還是國外都不缺少由于資金周轉(zhuǎn)問題跑路的P2P企業(yè)库糠。整個P2P行業(yè)也因為其自身相對的高風(fēng)險伙狐,高利率而競爭激烈涮毫。不少公司往往陷入了高利率-高風(fēng)險-高負(fù)擔(dān),面臨資金鏈斷裂贷屎。P2P平臺在起步階段除了少數(shù)資金雄厚的公司罢防,大部分公司,無論是P2P平臺還是名義上為P2P實質(zhì)為金融公司唉侄,主要目標(biāo)還是在吸納貸款咒吐,擴張市場,還難以研發(fā)門檻較高属划,耗時較長的針對P2P的大數(shù)據(jù)技術(shù)恬叹。
(2)大數(shù)據(jù)本身的困境
誠然,大數(shù)據(jù)是未來P2P的必然方向同眯,但是目前除了美國有完整的征信體系绽昼,很多國家尚未構(gòu)建自己的征信系統(tǒng),P2P平臺難以從國家和企業(yè)獲得自己想要的數(shù)據(jù)嗽测。這就不得不在早期增加很多的試錯成本绪励。
大數(shù)據(jù)的技術(shù)難度要求高并且需要較高的數(shù)據(jù)處理技術(shù),首先處理非結(jié)構(gòu)數(shù)據(jù)的技術(shù)難度較大唠粥,其次模型需要大量的數(shù)據(jù)投喂疏魏,驗證,最后需要很長的時間來處理變量晤愧。
?
?
參考文獻(xiàn)
[1]劉春霖.基于大數(shù)據(jù)技術(shù)的銀行業(yè)發(fā)展分析[J].硅谷, 2015(04):105-106.
[2]鄧建鵬,熊明,任一奇,等.大數(shù)據(jù)在P2P網(wǎng)貸中的應(yīng)用與困境[J].金融電子化, 2014(12):38-40.
[3]李學(xué)龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國科學(xué):信息科學(xué), 2015(01).
[4]Manyika J, Chui M, Brown B, et al. Big Data: The Next Frontier for Innovation, Competition, and Productivity[J]. Analytics, 2011.
[5]陳偉.大數(shù)據(jù)引領(lǐng)P2P信貸行業(yè)發(fā)展[J].時代報告:學(xué)術(shù)版, 2015(1):217-217.
[6]希財資訊.P2P網(wǎng)絡(luò)借貸與傳統(tǒng)金融的區(qū)別[EB/OL]. http://www.csai.cn/touzi/594197.html.2014-09-09
[7]安心貸.P2P網(wǎng)貸相對于傳統(tǒng)貸款的優(yōu)勢比較[EB/OL].http://www.anxin.com/news/industry/3336.html.2015-01-20
[9]P2P投資理財和傳統(tǒng)銀行深處的不同(https://www.batiaoyu.com/stc-4260-news-txt.htm)
[10]八條魚.銀行貸款和P2P網(wǎng)貸對比分析[EB/OL].http://www.douban.com/note/458686514/.2015-05-26
[11]曾偉,孔新川,陳威,等.大數(shù)據(jù)發(fā)現(xiàn)銀行貸款風(fēng)險[J].大數(shù)據(jù), 2015(02).
[12]彭濤.大數(shù)據(jù)時代的小微信貸――兼論銀行與電商平臺的競合關(guān)系[J].時代金融旬刊, 2013(15).
[13]張琪,張鑫.我國個人征信體系市場化研究――以芝麻信用分為例[J].現(xiàn)代商貿(mào)工業(yè), 2015, 36(16):173-175.