內(nèi)容來源:2018年11月16日,在Money20/20“全球金融科技創(chuàng)新大會”上坑夯, ZRobot CEO喬楊受邀出席科技會場并發(fā)表了“數(shù)字科技驅(qū)動(dòng)的信貸反欺詐技術(shù)”主題演講岖寞。筆記俠作為合作方,經(jīng)講者審閱授權(quán)發(fā)布柜蜈。喬楊:ZRobot CEO仗谆,擁有美國愛荷華大學(xué)經(jīng)濟(jì)學(xué)碩士及MBA、芝加哥大學(xué)計(jì)算機(jī)碩士淑履、SAS認(rèn)證師等多個(gè)頭銜隶垮。前Discover上海全球決策中心風(fēng)控策略及大數(shù)據(jù)建模業(yè)務(wù)負(fù)責(zé)人。封圖設(shè)計(jì)&責(zé)編 |?麗麗第 2702 篇深度好文:3335 字 | 5分鐘閱讀
活動(dòng)筆記·大數(shù)據(jù)
本文優(yōu)質(zhì)度:★★★★★?口感:內(nèi)蒙古牛肉
筆記俠說:
為什么欺詐案層出不窮秘噪?
相較于美國狸吞,中國防范欺詐風(fēng)險(xiǎn)更加迫切?
如何提升風(fēng)險(xiǎn)認(rèn)知指煎?
以下蹋偏,盡情享用
大家好,今天想和大家分享的主題是“數(shù)字科技驅(qū)動(dòng)的信貸反欺詐技術(shù)”至壤。
大家會發(fā)現(xiàn)暖侨,媒體上經(jīng)常會出現(xiàn)一些像醫(yī)美中介欺詐、黑中介騙貸崇渗、洗錢套現(xiàn)等與欺詐相關(guān)的報(bào)道字逗,觸目驚心京郑。
為什么欺詐案層出不窮?
因?yàn)殡S著中國消費(fèi)信貸及互聯(lián)網(wǎng)化的飛速發(fā)展葫掉,信貸產(chǎn)品種類日益豐富些举,欺詐的手段也在不斷更新進(jìn)化。
從早期的傳統(tǒng)欺詐手段俭厚,已經(jīng)逐步進(jìn)化為更加先進(jìn)户魏、更難察覺的新型欺詐手段,比如早期的利誘員工到如今的潛入機(jī)構(gòu)挪挤,本人申請到資信包裝等叼丑。
欺詐分子是一群高智商且勤奮努力的人群,而欺詐防范手段相對滯后扛门,使得欺詐案件層出不窮鸠信。
在美國,欺詐損失比例為10%论寨,中國信貸環(huán)境更加惡劣星立,欺詐損失比例為50%甚至更高。因此葬凳,在中國绰垂,防范欺詐風(fēng)險(xiǎn)更加迫切。
一火焰、數(shù)字科技加持
風(fēng)險(xiǎn)認(rèn)知升級
對于不同的欺詐類型劲装,我們需要從不同的維度進(jìn)行考慮。
這里我主要分享三個(gè)維度:了解客戶昌简、了解員工占业、了解對手。
欺詐風(fēng)險(xiǎn)的防范必須了解所有交易對象江场,否則纺酸,就會出現(xiàn)疏漏。
比如址否,如果我們只是了解員工和對手餐蔬,而不了解客戶,就會遺漏客戶方的欺詐風(fēng)險(xiǎn)佑附;
如果只了解客戶和員工樊诺,就會給黑產(chǎn)、團(tuán)伙欺詐等第三方欺詐以機(jī)會音同。
如上圖词爬。右邊不同的顏色對應(yīng)欺詐類型的防范措施,比如建立完善的內(nèi)控合規(guī)制度可以有效防范員工內(nèi)部欺詐权均。
但黑產(chǎn)識別是反欺詐領(lǐng)域最為關(guān)鍵的環(huán)節(jié)顿膨,在這一環(huán)節(jié)锅锨,ZRobot進(jìn)行了大量的嘗試和探索。
我們認(rèn)為恋沃,通過生物識別技術(shù)必搞、點(diǎn)面結(jié)合的復(fù)雜網(wǎng)絡(luò)+機(jī)器學(xué)習(xí)技術(shù)(也稱之為“漫網(wǎng)技術(shù)”)以及欺詐模型識別囊咏。
尤其是我們提出的“斑馬”擴(kuò)散技術(shù)是三方欺詐的最為有效的防范手段恕洲。
什么是“斑馬”擴(kuò)散技術(shù)?
“斑馬”擴(kuò)散技術(shù)不難理解梅割,它是通過復(fù)雜網(wǎng)絡(luò)的這種關(guān)聯(lián)擴(kuò)散霜第,基于無監(jiān)督學(xué)習(xí)模型以及專家經(jīng)驗(yàn),進(jìn)而把黑戶及黑戶的關(guān)聯(lián)用戶和白戶及白戶的關(guān)聯(lián)用戶區(qū)分開來户辞。
“斑馬”擴(kuò)散技術(shù)不但可以更有效的識別開放申請中的 “壞”用戶泌类,增加欺詐分子突破反欺詐防線的難度,提高作案成本咆课。
而且還可以在營銷活動(dòng)中末誓,覆蓋更多的好用戶扯俱,節(jié)約授信成本并提高效率书蚪。
欺詐不僅要關(guān)注“黑”,更需要服務(wù)好“白”迅栅。
二殊校、證明“你”是“你”
反欺詐的核心是證明交易對手是客戶本人。
通過輕量級的前端SDK生物探針部署读存,捕捉用戶多維度的生物行為并在云端實(shí)時(shí)計(jì)算判斷为流。
同時(shí)結(jié)合傳統(tǒng)的人臉、指紋及聲紋識別让簿,就可以在保障客戶體驗(yàn)的同時(shí)實(shí)現(xiàn)欺詐風(fēng)險(xiǎn)防范的目的敬察。
這種方式優(yōu)勢顯著,它無需硬件支持尔当,驗(yàn)證過程無感知莲祸,無需用戶主動(dòng)配合,可以進(jìn)行連續(xù)判斷椭迎,同時(shí)锐帜,可實(shí)現(xiàn)實(shí)時(shí)風(fēng)險(xiǎn)決策。
1. 由點(diǎn)及面畜号,團(tuán)伙消滅
隨著欺詐手段的不斷升級缴阎,欺詐的團(tuán)伙化特征也日益明顯,欺詐的上下游產(chǎn)業(yè)鏈也越來越龐大简软,越來越成熟蛮拔。
僅僅通過對個(gè)人的欺詐風(fēng)險(xiǎn)判斷不能防范團(tuán)伙作案帶來的影響和損失述暂。
我們提出的漫網(wǎng)技術(shù)有效地解決了這個(gè)問題,類似于谷歌提出的Graph Learning建炫,對用戶全方位的關(guān)聯(lián)關(guān)系進(jìn)行識別贸典。
包括設(shè)備關(guān)聯(lián)、通信關(guān)聯(lián)等踱卵,構(gòu)建用戶的關(guān)系網(wǎng)絡(luò)圖譜廊驼,通過無監(jiān)督算法將無差別用戶劃分為不同群組。
同時(shí)惋砂,針對關(guān)聯(lián)關(guān)系強(qiáng)弱進(jìn)行判斷設(shè)定權(quán)重妒挎。
2.探索創(chuàng)新-欺詐模型
與傳統(tǒng)信用模型相比,欺詐模型構(gòu)建存在很大挑戰(zhàn)西饵。
首先酝掩,基于業(yè)務(wù)知識及豐富的案件識別能力來判斷哪些交易可定性為欺詐交易。
有了穩(wěn)定的案件庫和欺詐數(shù)據(jù)標(biāo)簽之后眷柔,用作目標(biāo)定義期虾。
特征工程設(shè)計(jì)的數(shù)據(jù)量及運(yùn)算量大,近實(shí)時(shí)的數(shù)據(jù)挖掘包括瀏覽數(shù)據(jù)驯嘱、網(wǎng)絡(luò)行為挖掘镶苞、網(wǎng)絡(luò)借貸、同一時(shí)間內(nèi)的設(shè)備環(huán)境等鞠评。
由于欺詐手段方法更具多樣性茂蚓,而信用風(fēng)險(xiǎn)主要來自還款能力和還款意愿,比較具象剃幌。
所以聋涨,設(shè)計(jì)多特征多子模型的融合,模型的更新迭代必須跟得上欺詐環(huán)境的變化负乡。
所以牍白,模型部署也要考慮這個(gè)問題,比如高頻定期的模型效果監(jiān)控抖棘,如何建立自適應(yīng)模型等茂腥。
3.探索創(chuàng)新-欺詐模型
在電商領(lǐng)域,用戶會在頁面留下大量觸點(diǎn)钉答,比如點(diǎn)擊瀏覽器不同層次的頁面础芍,但幾乎所有層次頁面都會到SKU或單品頁面。
所以数尿,我們提出了item2vector概念仑性,類似文本挖掘領(lǐng)域的text2vector或word2vector,將文本分類為向量矩陣右蹦。
比如高頻低頻文本诊杆,然后進(jìn)行情感分析歼捐、語義分析等。
所以晨汹,我們將電商領(lǐng)域的item抽出豹储,把用戶瀏覽器路徑轉(zhuǎn)換為向量形式,就可以用向量來描述一個(gè)用戶在一個(gè)瀏覽session中對哪些品類或單品產(chǎn)生瀏覽記錄淘这。
由于瀏覽是有時(shí)間順序的剥扣,所以,我們將整個(gè)頁面瀏覽時(shí)間順序和向量放入卷積神經(jīng)網(wǎng)絡(luò)模型中加工訓(xùn)練特征铝穷,通過RNN方式提煉了大量原本通過人類業(yè)務(wù)經(jīng)驗(yàn)或其他構(gòu)件特征方法所不能提煉的特征钠怯。
這些特征作為機(jī)器學(xué)習(xí)模型訓(xùn)練特征可大幅提升模型效果。
這是我們對于深度學(xué)習(xí)方面的突破曙聂,有了這一理論基礎(chǔ)晦炊,以及我們對于整個(gè)用戶畫像標(biāo)簽的深度挖掘能力,就可以把自身積累的經(jīng)驗(yàn)對外進(jìn)行賦能宁脊。
三断国、ZRobot是誰?
ZRobot作為京東金融旗下智能大數(shù)據(jù)服務(wù)平臺榆苞,成立于2016年11月稳衬。
ZRobot致力于利用京東海量高維的數(shù)據(jù)資源,結(jié)合硅谷最先進(jìn)的數(shù)據(jù)挖掘技術(shù)和模型算法语稠,通過京東金融豐富的金融應(yīng)用場景宋彼,不斷打磨提升自身技術(shù)實(shí)力的同時(shí)對外賦能弄砍,幫助合作伙伴提升自身的風(fēng)控實(shí)力和運(yùn)營效率仙畦。
目前已為銀行、保險(xiǎn)音婶、信托慨畸、消費(fèi)金融、融資租賃衣式、小貸公司等金融機(jī)構(gòu)提供各類數(shù)據(jù)產(chǎn)品支持及智能風(fēng)控智能營銷解決方案寸士,合作機(jī)構(gòu)近300家。
它的核心競爭力主要包括兩個(gè)層面:
第一碴卧、 數(shù)據(jù)源優(yōu)勢明顯
作為股東及主要數(shù)據(jù)源之一弱卡,京東金融的數(shù)據(jù)具備大、厚住册、動(dòng)的特點(diǎn)婶博,也就是數(shù)據(jù)量大,數(shù)據(jù)維度高荧飞,同時(shí)具備實(shí)時(shí)更新的能力凡人。
基于自身多年在電商零售及不同金融場景下的積累名党,京東金融每天新增的數(shù)據(jù)量級達(dá)到800TB,比一些小型科技公司1年的數(shù)據(jù)增量還要多挠轴。
同時(shí)传睹,京東金融已與700多家金融機(jī)構(gòu)合作,共同服務(wù)線上線下商戶達(dá)800萬個(gè)岸晦,個(gè)人用戶數(shù)量超過4億欧啤。可入?yún)⒛P妥兞砍^60萬維启上,已搭建并成功應(yīng)用的風(fēng)險(xiǎn)策略超過5000個(gè)堂油,風(fēng)險(xiǎn)模型超過500個(gè)。
活躍客戶65%以上為80后主力消費(fèi)人群碧绞,也是消費(fèi)及金融領(lǐng)域的核心客戶人群府框。
除了京東金融及京東體系的數(shù)據(jù)之外,ZRobot也與中國銀聯(lián)讥邻、三大運(yùn)營商等頭部數(shù)據(jù)合作方展開深度合作迫靖,加上與騰訊、百度等聯(lián)手成立的京騰計(jì)劃兴使、京度計(jì)劃等系宜,目前可對超過6億的個(gè)人進(jìn)行準(zhǔn)確的風(fēng)險(xiǎn)評估。
有了強(qiáng)大的數(shù)據(jù)基礎(chǔ)发魄,ZRobot可以將數(shù)據(jù)技術(shù)發(fā)揮到極致盹牧,目前在AI領(lǐng)域?qū)崿F(xiàn)了一系列突破包括全流程智能風(fēng)險(xiǎn)識別,生物識別励幼,AI模型能力等汰寓。
第二、模型算法和特征工程苹粟。
特征工程是建模流程中最為重要的環(huán)節(jié)有滑。
在大數(shù)據(jù)領(lǐng)域的人,應(yīng)該比較了解坊間一直流傳的一句話:“數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限嵌削,模型和算法只是逼近這個(gè)上限的手段而已毛好。”
我認(rèn)為在整個(gè)大數(shù)據(jù)領(lǐng)域的核心壁壘或者說核心競爭力就是數(shù)據(jù)和特征工程苛秕。
(這里我就不做贅述了肌访,詳情請查看上一次的精彩分享:失信者,將無處可逃)艇劫。
以上就是我著重介紹的ZRobot在反欺詐領(lǐng)域中進(jìn)行的創(chuàng)新和嘗試吼驶,大家有什么問題,歡迎你在留言區(qū)留言,我們一起討論和研究旨剥,謝謝咧欣!
ZRobot是由數(shù)字科技公司京東金融成立的金融科技公司。
基于高維度變量轨帜,結(jié)合豐富的應(yīng)用場景魄咕,利用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等專業(yè)技術(shù),致力于構(gòu)建大數(shù)據(jù)背景下的信用生態(tài)體系蚌父。
作為京東金融旗下智能數(shù)據(jù)技術(shù)服務(wù)商哮兰,以大數(shù)據(jù)和靈活完善的風(fēng)控模型為基礎(chǔ),實(shí)時(shí)評估業(yè)務(wù)風(fēng)險(xiǎn)苟弛,為銀行喝滞、消費(fèi)金融公司、汽車金融等金融機(jī)構(gòu)提供智能化風(fēng)控管理解決方案膏秫,提升企業(yè)整體風(fēng)控能力右遭。
*文章為講者獨(dú)立觀點(diǎn),不代表筆記俠立場缤削。