在上周三的極牛技術(shù)分享活動(dòng)里输钩,我做了一場(chǎng) topic 是《 AI in Dianrong Risk》的分享嫉嘀。主要介紹了一些我們關(guān)注的人工智能技術(shù)可能在哪些方面會(huì)對(duì)金融行業(yè)帶來(lái)一些變革呻此,以及在點(diǎn)融我們是怎么將人工智能技術(shù)應(yīng)用于風(fēng)險(xiǎn)控制的事扭。
互聯(lián)網(wǎng)上有這樣一個(gè)關(guān)于 AI 的定義:
AI is the science and engineering of making intelligent machines and computer programs capable of learning and problem solving in ways that normally require human intelligence.
AI 是運(yùn)用智能硬件和計(jì)算機(jī)程序虏束,解決在一般情況下需要人腦解決的問(wèn)題的科學(xué)技術(shù)啤斗。
傳統(tǒng)金融如何利用數(shù)據(jù)?
所謂前事不忘后事之師赁咙,在了解 ?AI 對(duì)傳統(tǒng)金融行業(yè)帶來(lái)的影響之前钮莲,我們可以借鑒以往的經(jīng)驗(yàn),看看傳統(tǒng)金融行業(yè)對(duì)現(xiàn)有數(shù)據(jù)的利用情況彼水。
在過(guò)去的幾十年甚至百十年中崔拥,無(wú)數(shù)的銀行家,金融工程師凤覆,數(shù)據(jù)分析師链瓦,金融從業(yè)者為我們?cè)O(shè)計(jì)了很多非常便利方便的金融產(chǎn)品,比如信用卡業(yè)務(wù)盯桦,個(gè)人貸款業(yè)務(wù)慈俯,在這些產(chǎn)品迭代的過(guò)程中他們形成了非常嚴(yán)謹(jǐn)?shù)牡惋L(fēng)險(xiǎn)控制的方案。
他們所利用數(shù)據(jù)的特點(diǎn)是針對(duì)這些金融產(chǎn)品業(yè)務(wù)區(qū)分能力強(qiáng)拥峦,但是覆蓋人群相對(duì)較低贴膘。
就如上圖所示的冰山,傳統(tǒng)金融行業(yè)對(duì)數(shù)據(jù)的利用率只有10%左右略号,而 Fintech 公司需要做的就是挖掘那些隱藏在冰山之下的數(shù)據(jù)刑峡,把金融產(chǎn)品帶給更廣泛的人群。
互聯(lián)網(wǎng)金融怎么做玄柠?
隨著大數(shù)據(jù)解決方案的普及突梦,我們可以搜集更多維度的數(shù)據(jù)來(lái)更精細(xì)的進(jìn)行用戶畫(huà)像,包括利用一些行業(yè)數(shù)據(jù)羽利,用戶的互聯(lián)網(wǎng)瀏覽數(shù)據(jù)宫患,司法執(zhí)行數(shù)據(jù),第三方信用數(shù)據(jù)铐伴,出行數(shù)據(jù)撮奏,電商平臺(tái)的交易數(shù)據(jù),電話通訊數(shù)據(jù)和社交數(shù)據(jù)当宴。這些數(shù)據(jù)的覆蓋人群會(huì)遠(yuǎn)遠(yuǎn)超過(guò)現(xiàn)有的金融行業(yè)所使用的數(shù)據(jù)畜吊。
而 AI? 就是對(duì)這些數(shù)據(jù)進(jìn)行組合,從而挖掘出有效的特征户矢。
如何利用好這些維度很高的數(shù)據(jù)玲献,需要一個(gè)智能的解決方案。因?yàn)檫@些數(shù)據(jù)大多是非結(jié)構(gòu)化的數(shù)據(jù),可能來(lái)自郵件捌年、視頻瓢娜、文本、語(yǔ)音礼预、點(diǎn)擊瀏覽行為眠砾、社交網(wǎng)絡(luò)等多種渠道。數(shù)據(jù)的量級(jí)和清洗是一個(gè)重要的環(huán)節(jié)托酸。
而大數(shù)據(jù)的一些解決方案為我們提供了較好的基礎(chǔ)設(shè)施褒颈。
關(guān)于 AI
在此之上人工智能可以帶給我們大量的自動(dòng)的規(guī)則學(xué)習(xí),同時(shí)帶給我們更加強(qiáng)大的表達(dá)能力励堡,而不僅僅是一些線性模型谷丸。當(dāng)我們加入更多數(shù)據(jù)的時(shí)候,關(guān)于人的描述已經(jīng)上升到更高維度的空間中应结,這時(shí)刨疼,我們就需要表達(dá)能力更強(qiáng)的模型,比如 GBDT 的模型鹅龄,有幾千個(gè)有權(quán)重的子樹(shù)揩慕,比如深度學(xué)習(xí)網(wǎng)絡(luò),多層的神經(jīng)元通過(guò)加工砾层,自動(dòng)抽取最優(yōu)組合漩绵。
一個(gè)傳統(tǒng)的貸款業(yè)務(wù)可能需要2-3天來(lái)審批,而一個(gè)基于人工智能模型的自動(dòng)審批方案可能只需要幾秒鐘就可以完成肛炮。同時(shí)有些傳統(tǒng)風(fēng)控模型的迭代周期可能要數(shù)個(gè)月甚至數(shù)年止吐,但是人工智能的模型迭代可以非常便捷和自動(dòng)。
AI 所做的就是極大簡(jiǎn)化這個(gè)過(guò)程侨糟,提高效率碍扔,同時(shí)可以大大提高模型驗(yàn)證和迭代的速度。
AI in Dianrong
在點(diǎn)融秕重,我們應(yīng)用于風(fēng)控的人工智能解決方案主要有以下三個(gè)部分:
數(shù)據(jù)搜集和處理
風(fēng)險(xiǎn)控制和預(yù)測(cè)模型
信用評(píng)級(jí)和風(fēng)險(xiǎn)定價(jià)
便利可擴(kuò)展的數(shù)據(jù)存儲(chǔ)和處理方案是重要的基礎(chǔ)架構(gòu)不同。
各種非結(jié)構(gòu)化數(shù)據(jù)到結(jié)構(gòu)化數(shù)據(jù)的靈活轉(zhuǎn)換是保證應(yīng)用的重要一環(huán)。
欺詐的識(shí)別是風(fēng)險(xiǎn)控制的第一步溶耘,如果利用第三方數(shù)據(jù)高準(zhǔn)確度地識(shí)別一些有欺詐嫌疑的用戶是這一個(gè)環(huán)節(jié)需要解決的問(wèn)題二拐。
靈活地支持人工智能的風(fēng)控引擎和規(guī)則引擎是保證人工智能應(yīng)用的業(yè)務(wù)的重要工具。點(diǎn)融的規(guī)則引擎同時(shí)可以支持簡(jiǎn)單的條件規(guī)則凳兵、也可以支持決策樹(shù)的規(guī)則百新,以及更加復(fù)雜的 GBDT 和深度神經(jīng)網(wǎng)絡(luò)模型。
通過(guò)知識(shí)圖譜我們可以將人群的關(guān)系更直接地映射到圖數(shù)據(jù)里庐扫,通過(guò)這些關(guān)系的遠(yuǎn)近饭望、和異常拓?fù)浣Y(jié)構(gòu)的識(shí)別仗哨,我們可以發(fā)現(xiàn)更多更深層次的風(fēng)險(xiǎn)模式,通過(guò)識(shí)別這些模式可以有效地減少團(tuán)伙欺詐铅辞。
在風(fēng)險(xiǎn)級(jí)別識(shí)別和風(fēng)險(xiǎn)定價(jià)的模塊里厌漂。我們會(huì)結(jié)合三類打分板:專家打分板,傳統(tǒng)的邏輯回歸打分板以及人工智能打分板在不同場(chǎng)景下針對(duì)用戶進(jìn)行不同級(jí)別的人群劃分斟珊。針對(duì)不同級(jí)別的人群和不同產(chǎn)品的需求我們會(huì)試算出針對(duì)于該風(fēng)險(xiǎn)人群的定價(jià)苇倡。
我們點(diǎn)融也在積極地將人工智能模型作為主要風(fēng)控手段迭代改進(jìn)自己的系統(tǒng)中。
同時(shí)我們也在應(yīng)用深度學(xué)習(xí)解決一些業(yè)務(wù)冷啟動(dòng)的問(wèn)題囤踩。利用 transfer learning我們可以大大加快模型在新業(yè)務(wù)數(shù)據(jù)不足的情況下收斂的速度雏节。
總結(jié)
最后引用薛貴榮博士的博客中一段話:
“基于實(shí)例的遷移學(xué)習(xí)的基本思想是,盡管輔助訓(xùn)練數(shù)據(jù)和源訓(xùn)練數(shù)據(jù)或多或少會(huì)有些不同高职,但是輔助訓(xùn)練數(shù)據(jù)中應(yīng)該還是會(huì)存在一部分比較適合用來(lái)訓(xùn)練一個(gè)有效的分類模型,并且適應(yīng)測(cè)試數(shù)據(jù)辞州。于是怔锌,我們的目標(biāo)就是從輔助訓(xùn)練數(shù)據(jù)中找出那些適合測(cè)試數(shù)據(jù)的實(shí)例,并將這些實(shí)例遷移到源訓(xùn)練數(shù)據(jù)的學(xué)習(xí)中去变过“T”
如何應(yīng)用深度學(xué)習(xí)挖掘一些特殊的特征,比如知識(shí)圖譜中基于拓?fù)浣Y(jié)構(gòu)的特征也是我們?cè)诜e極探索的一些內(nèi)容媚狰。
本文作者:單憶南Sync(點(diǎn)融黑幫)岛杀, 點(diǎn)融網(wǎng)數(shù)據(jù)負(fù)責(zé)人,曾就職于國(guó)內(nèi)崭孤、國(guó)際大型互聯(lián)網(wǎng)公司类嗤,并從事搜索引擎,搜索廣告和電商垂直搜索的研發(fā)工作辨宠。2015年加入點(diǎn)融遗锣,參與組建數(shù)據(jù)團(tuán)隊(duì),根據(jù)公司業(yè)務(wù)情況建立了從數(shù)據(jù)倉(cāng)庫(kù)嗤形、BI精偿、數(shù)據(jù)挖掘到自主研發(fā)的風(fēng)控引擎的設(shè)計(jì)和實(shí)施。