盤點金融領(lǐng)域里常用的深度學(xué)習模型

作者 | Sonam Srivastava

譯者 | sambodhi

編輯 | Vincent

AI前線出品| ID:ai-front

AI 前線導(dǎo)語:近年來及刻,深度學(xué)習在金融領(lǐng)域曾經(jīng)被廣泛運用,如圖像識別、智能客服胁黑、智能投顧等净响。深度學(xué)習也越來越成為投資和研討的熱點讥电。

在今天我們發(fā)布的這篇文章中放吩,作者 Sonam Srivastava 介紹了金融中的三種深度學(xué)習用例及這些模型優(yōu)劣的證據(jù)。

我們跟隨 Sonam Srivastava 的分析根欧,并展望深度學(xué)習在金融領(lǐng)域的運用前景怜珍。雖然金融是計算密集型最多的領(lǐng)域,但廣泛使用的金融模型:監(jiān)督和無監(jiān)督模型凤粗、基于狀態(tài)的模型酥泛、計量經(jīng)濟學(xué)模型甚至隨機模型都受到過度擬合和啟發(fā)式問題帶來的影響,抽樣結(jié)果很差嫌拣。因為金融生態(tài)圈異常復(fù)雜揭璃,其非線性充斥著大量的相互影響的因素。

要解決這個問題亭罪,如果我們考慮到深度學(xué)習在圖像識別瘦馍、語音識別或情感分析方面所做的研究,我們就會看到這些模型能夠從大規(guī)模未標記數(shù)據(jù)中學(xué)習应役,形成非線性關(guān)系的遞歸結(jié)構(gòu)情组,可以輕松予以調(diào)整以避免發(fā)生過度擬合。

如果金融生態(tài)圈能夠使用這些網(wǎng)絡(luò)進行建模箩祥,應(yīng)用領(lǐng)域就會深遠而廣泛院崇。這些模型可用于定價、投資組合構(gòu)建袍祖、風險管理甚至高頻交易等領(lǐng)域底瓣,讓我們來解決這些問題。

收益預(yù)測

以預(yù)測每日黃金價格的抽樣問題為例,我們首先看看傳統(tǒng)的方法捐凭。

ARIMA 模型

ARIMA 模型(Autoregressive Integrated Moving Average model)拨扶,差分整合移動平均自回歸模型,又稱整合移動平均自回歸模型(移動也可稱作滑動)茁肠,時間序列預(yù)測分析方法之一患民。ARIMA(p,d垦梆,q)中匹颤,AR 是“自回歸”,p 為自回歸項數(shù)托猩;MA 為“滑動平均”印蓖,q 為滑動平均項數(shù),d 為使之成為平穩(wěn)序列所做的差分次數(shù)(階數(shù))京腥∩馑啵“差分”一詞雖未出現(xiàn)在 ARIMA 的英文名稱中,卻是關(guān)鍵步驟绞旅。

ARIMA 模型的基本思想是:將預(yù)測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列摆尝,用一定的數(shù)學(xué)模型來近似描述這個序列温艇。這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預(yù)測未來值∫虮現(xiàn)代統(tǒng)計方法、計量經(jīng)濟模型在某種程度上已經(jīng)能夠幫助企業(yè)對未來進行預(yù)測勺爱。利用整合移動平均自回歸模型晃琳,來嘗試預(yù)測季節(jié)性平穩(wěn)時間序列,我們得到結(jié)果如下圖所示:

VAR 模型

VAR 模型琐鲁,(Vector Autoregression model)向量自回歸模型卫旱,是一種常用的計量經(jīng)濟模型,由計量經(jīng)濟學(xué)家和宏觀經(jīng)濟學(xué)家 Christopher Sims 提出围段。它擴充了只能使用一個變量的自回歸模型(簡稱:AR 模型)顾翼,使容納大于 1 個變量,因此經(jīng)常用在多變量時間序列模型的分析上奈泪。

如果我們將相關(guān)的預(yù)測變量添加到我們的自回歸模型中并移動到向量自回歸模型适贸,我們得到結(jié)果如下圖所示:

深度回歸模型

如果在數(shù)據(jù)上使用簡單的深度回歸模型,使用相同的輸入涝桅,會得到更好的結(jié)果拜姿,如下圖所示:

卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是一種前饋神經(jīng)網(wǎng)絡(luò),它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元冯遂,對于大型圖像處理有出色表現(xiàn)蕊肥。

卷積神經(jīng)網(wǎng)絡(luò)由一個或多個卷積層和頂端的全連通層(對應(yīng)經(jīng)典的神經(jīng)網(wǎng)絡(luò))組成,同時也包括關(guān)聯(lián)權(quán)重和池化層(pooling layer)蛤肌。這一結(jié)構(gòu)使得卷積神經(jīng)網(wǎng)絡(luò)能夠利用輸入數(shù)據(jù)的二維結(jié)構(gòu)壁却。與其他深度學(xué)習結(jié)構(gòu)相比批狱,卷積神經(jīng)網(wǎng)絡(luò)在圖像和語音識別方面能夠給出更好的結(jié)果。這一模型也可以使用反向傳播算法進行訓(xùn)練儒洛。相比較其他深度精耐、前饋神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)需要考量的參數(shù)更少琅锻,使之成為一種頗具吸引力的深度學(xué)習結(jié)構(gòu)卦停。

修改我的架構(gòu),使用卷積神經(jīng)網(wǎng)絡(luò)來解決同一個問題恼蓬,得到結(jié)果如下圖所示:

所得結(jié)果大為改善惊完。但最好的結(jié)果還在后頭。

長短期記憶網(wǎng)絡(luò)

長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory处硬, LSTM)是一種時間遞歸神經(jīng)網(wǎng)絡(luò) (RNN)小槐,論文首次發(fā)表于 1997 年。由于獨特的設(shè)計結(jié)構(gòu)荷辕,LSTM 適合于處理和預(yù)測時間序列中間隔和延遲非常長的重要事件凿跳。

LSTM 的表現(xiàn)通常比時間遞歸神經(jīng)網(wǎng)絡(luò)及隱馬爾科夫模型(HMM)更好,比如用在不分段連續(xù)手寫識別上疮方。2009 年控嗜,用 LSTM 構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)模型贏得過 ICDAR 手寫識別比賽冠軍。LSTM 還普遍用于自主語音識別骡显,2013 年運用 TIMIT 自然演講數(shù)據(jù)庫達成 17.7% 錯誤率的紀錄疆栏。作為非線性模型,LSTM 可作為復(fù)雜的非線性單元用于構(gòu)造更大型深度神經(jīng)網(wǎng)絡(luò)惫谤。

使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變種后壁顶,我得到結(jié)果如下所示:

因此,整體來說均方誤差的趨勢出乎意料溜歪。

投資組合構(gòu)建

我們嘗試使用深度學(xué)習解決的第二個金融問題是投資組合構(gòu)建若专。在這個問題上,深度學(xué)習的實際應(yīng)用效果很好蝴猪。我的研究靈感來自這篇論文:《深度投資組合》(https://0x9.me/8uOBt)

這篇論文的作者嘗試構(gòu)建自動編碼器调衰,將時間序列映射到自身。使用這些自動編碼器的預(yù)測誤差成為股票測試版(與市場相關(guān))的代用指標拯腮,自動編碼器用作市場的模型窖式。

自動編碼器(auto-encoder),是一種無監(jiān)督的學(xué)習算法动壤,主要用于數(shù)據(jù)的降維或者特征的抽取萝喘,在深度學(xué)習中,自動編碼器可用于在訓(xùn)練階段開始前,確定權(quán)重矩陣 W 的初始值阁簸∨涝纾基于上述自動編碼器的誤差選擇不同的股票,我們可以使用另一個深度神經(jīng)網(wǎng)絡(luò)來構(gòu)建深度指標启妹,結(jié)果相當不錯筛严,如下圖所示:

深度神經(jīng)網(wǎng)絡(luò)已成為利用股票復(fù)制指數(shù)的指數(shù)構(gòu)建方法。

但這只是它的開始饶米!如果我們應(yīng)用智能索引桨啃,在我去掉指數(shù)的極端下降期,并在智能索引上訓(xùn)練我的指數(shù)映射深度神經(jīng)網(wǎng)絡(luò)時檬输,我就能以驚人的速度超過指數(shù)照瘾!

這種技術(shù)在證券投資組合領(lǐng)域有著巨大的潛力!

結(jié)論

目前金融業(yè)的趨勢是朝更復(fù)雜丧慈、更健全的的模式發(fā)展析命。隨著大量數(shù)據(jù)科學(xué)家涌入該行業(yè),對所有銀行來說逃默,技術(shù)是一個巨大的壓力鹃愤。像 RelTec、Worldquant 這樣的對沖基金完域,在其交易中已經(jīng)使用這種技術(shù)软吐。由于這些復(fù)雜模型在其他領(lǐng)域所表現(xiàn)出的優(yōu)異結(jié)果,以及在金融建模領(lǐng)域的巨大差距筒主,將會有一系列的戲劇性的創(chuàng)新涌現(xiàn)关噪!

更好地解決金融和貿(mào)易領(lǐng)域的關(guān)鍵問題鸟蟹,將會提高效率乌妙、提高透明度、加強風險管理和新的創(chuàng)新建钥。

譯者感言

深度學(xué)習的一大優(yōu)勢在于可以大幅減少人工參與的特征工程去“擬合”訓(xùn)練數(shù)據(jù)藤韵,但這也不是說完全不需要人去參與特征的選取,尤其是金融市場熊经,數(shù)據(jù)簡直是海量泽艘,并且大都高噪聲,非穩(wěn)定镐依,所以除非你能夠清楚哪些數(shù)據(jù)具有潛在價值匹涮、如何做適當?shù)念A(yù)處理和如何轉(zhuǎn)化并達成哪些目標,否則深度學(xué)習在金融領(lǐng)域是無法應(yīng)用的槐壳。

如果設(shè)計得當然低,增加神經(jīng)網(wǎng)絡(luò)的深度可以對更復(fù)雜的模式進行映射,因此可對金融數(shù)據(jù)的訓(xùn)練產(chǎn)生更好效果。

例如 CNN 適合處理圖像一類的大數(shù)據(jù)雳攘,不一定直接適用于金融數(shù)據(jù)带兜。金融數(shù)據(jù)雖然也可以很大,但通常不在一個數(shù)量級上——一幅圖像中的樣本數(shù)(像素吨灭、顏色)很容易上百萬刚照,要訓(xùn)練一個模型又要用到成千上萬個圖像,為了找到高效辦法提取特征喧兄,于是計算機科學(xué)家想出了卷積神經(jīng)網(wǎng)絡(luò)通過抽取特征值來簡化運算復(fù)雜度无畔。而我們處理的金融時間序列數(shù)據(jù),單組樣本的數(shù)量常在百萬以下吠冤,規(guī)模上往往不需要卷積檩互。進一步比較,相對于金融數(shù)據(jù)咨演,圖像識別的特點是數(shù)據(jù)量龐大闸昨、特征明顯、特征重復(fù)次數(shù)多薄风、特征組合性強饵较、出現(xiàn)的次序性、特征呈現(xiàn)的方向性有時不強遭赂,這與金融數(shù)據(jù)噪音大循诉、數(shù)量較小的特點有所不同。因此撇他,在訓(xùn)練金融數(shù)據(jù)時很有必要設(shè)計有針對性的深度機器學(xué)習模型茄猫。

本文涉及到的代碼可在作者的 GitHub Repo 中找到

https://0x9.me/P5ahd

原文鏈接

https://medium.com/towards-data-science/deep-learning-in-finance-9e088cb17c03

-全文完-

關(guān)注人工智能的落地實踐,與企業(yè)一起探尋 AI 的邊界困肩,AICon 全球人工智能技術(shù)大會火熱售票中划纽,8 折倒計時一周搶票,詳情點擊:

https://aicon.geekbang.org/?utm_source=ai-front&utm_medium=zhihu

《深入淺出TensorFlow》迷你書現(xiàn)已發(fā)布锌畸,關(guān)注公眾號“AI前線”勇劣,ID:ai-front,回復(fù)關(guān)鍵字:TF潭枣,獲取下載鏈接比默!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市盆犁,隨后出現(xiàn)的幾起案子命咐,更是在濱河造成了極大的恐慌,老刑警劉巖谐岁,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件醋奠,死亡現(xiàn)場離奇詭異瓮下,居然都是意外死亡,警方通過查閱死者的電腦和手機钝域,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進店門讽坏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人例证,你說我怎么就攤上這事路呜。” “怎么了织咧?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵胀葱,是天一觀的道長。 經(jīng)常有香客問我笙蒙,道長抵屿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任捅位,我火速辦了婚禮轧葛,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘艇搀。我一直安慰自己尿扯,他們只是感情好,可當我...
    茶點故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布焰雕。 她就那樣靜靜地躺著衷笋,像睡著了一般。 火紅的嫁衣襯著肌膚如雪矩屁。 梳的紋絲不亂的頭發(fā)上辟宗,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天,我揣著相機與錄音吝秕,去河邊找鬼泊脐。 笑死,一個胖子當著我的面吹牛郭膛,可吹牛的內(nèi)容都是我干的晨抡。 我是一名探鬼主播氛悬,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼则剃,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了如捅?” 一聲冷哼從身側(cè)響起棍现,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎镜遣,沒想到半個月后己肮,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體士袄,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年谎僻,在試婚紗的時候發(fā)現(xiàn)自己被綠了娄柳。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,769評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡艘绍,死狀恐怖赤拒,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情诱鞠,我是刑警寧澤挎挖,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站航夺,受9級特大地震影響蕉朵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜阳掐,卻給世界環(huán)境...
    茶點故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一始衅、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧缭保,春花似錦觅闽、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至彻亲,卻和暖如春孕锄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背苞尝。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工畸肆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人宙址。 一個月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓轴脐,卻偏偏與公主長得像,于是被迫代替她去往敵國和親抡砂。 傳聞我的和親對象是個殘疾皇子大咱,可洞房花燭夜當晚...
    茶點故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 1碴巾、她的掌心有一道疤, 切斷了事業(yè)線丑搔、生命線厦瓢、愛情線提揍。 這是他留給她的傷痕, 永不磨滅煮仇。 整整十五年劳跃,他終于愛上了...
    清橙布衣閱讀 636評論 0 0
  • 心靜謐的如湖的時刻,音符落在堤岸 會有漣漪一圈一圈將我包圍住 不掙扎浙垫,沒有困于牢籠的絕望 終會悄無聲息的歸于靜默 ...
    938377db52e3閱讀 311評論 0 1