作者 | Sonam Srivastava
譯者 | sambodhi
編輯 | Vincent
AI前線出品| ID:ai-front
AI 前線導(dǎo)語:近年來及刻,深度學(xué)習在金融領(lǐng)域曾經(jīng)被廣泛運用,如圖像識別、智能客服胁黑、智能投顧等净响。深度學(xué)習也越來越成為投資和研討的熱點讥电。
在今天我們發(fā)布的這篇文章中放吩,作者 Sonam Srivastava 介紹了金融中的三種深度學(xué)習用例及這些模型優(yōu)劣的證據(jù)。
我們跟隨 Sonam Srivastava 的分析根欧,并展望深度學(xué)習在金融領(lǐng)域的運用前景怜珍。雖然金融是計算密集型最多的領(lǐng)域,但廣泛使用的金融模型:監(jiān)督和無監(jiān)督模型凤粗、基于狀態(tài)的模型酥泛、計量經(jīng)濟學(xué)模型甚至隨機模型都受到過度擬合和啟發(fā)式問題帶來的影響,抽樣結(jié)果很差嫌拣。因為金融生態(tài)圈異常復(fù)雜揭璃,其非線性充斥著大量的相互影響的因素。
要解決這個問題亭罪,如果我們考慮到深度學(xué)習在圖像識別瘦馍、語音識別或情感分析方面所做的研究,我們就會看到這些模型能夠從大規(guī)模未標記數(shù)據(jù)中學(xué)習应役,形成非線性關(guān)系的遞歸結(jié)構(gòu)情组,可以輕松予以調(diào)整以避免發(fā)生過度擬合。
如果金融生態(tài)圈能夠使用這些網(wǎng)絡(luò)進行建模箩祥,應(yīng)用領(lǐng)域就會深遠而廣泛院崇。這些模型可用于定價、投資組合構(gòu)建袍祖、風險管理甚至高頻交易等領(lǐng)域底瓣,讓我們來解決這些問題。
收益預(yù)測
以預(yù)測每日黃金價格的抽樣問題為例,我們首先看看傳統(tǒng)的方法捐凭。
ARIMA 模型
ARIMA 模型(Autoregressive Integrated Moving Average model)拨扶,差分整合移動平均自回歸模型,又稱整合移動平均自回歸模型(移動也可稱作滑動)茁肠,時間序列預(yù)測分析方法之一患民。ARIMA(p,d垦梆,q)中匹颤,AR 是“自回歸”,p 為自回歸項數(shù)托猩;MA 為“滑動平均”印蓖,q 為滑動平均項數(shù),d 為使之成為平穩(wěn)序列所做的差分次數(shù)(階數(shù))京腥∩馑啵“差分”一詞雖未出現(xiàn)在 ARIMA 的英文名稱中,卻是關(guān)鍵步驟绞旅。
ARIMA 模型的基本思想是:將預(yù)測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列摆尝,用一定的數(shù)學(xué)模型來近似描述這個序列温艇。這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預(yù)測未來值∫虮現(xiàn)代統(tǒng)計方法、計量經(jīng)濟模型在某種程度上已經(jīng)能夠幫助企業(yè)對未來進行預(yù)測勺爱。利用整合移動平均自回歸模型晃琳,來嘗試預(yù)測季節(jié)性平穩(wěn)時間序列,我們得到結(jié)果如下圖所示:
VAR 模型
VAR 模型琐鲁,(Vector Autoregression model)向量自回歸模型卫旱,是一種常用的計量經(jīng)濟模型,由計量經(jīng)濟學(xué)家和宏觀經(jīng)濟學(xué)家 Christopher Sims 提出围段。它擴充了只能使用一個變量的自回歸模型(簡稱:AR 模型)顾翼,使容納大于 1 個變量,因此經(jīng)常用在多變量時間序列模型的分析上奈泪。
如果我們將相關(guān)的預(yù)測變量添加到我們的自回歸模型中并移動到向量自回歸模型适贸,我們得到結(jié)果如下圖所示:
深度回歸模型
如果在數(shù)據(jù)上使用簡單的深度回歸模型,使用相同的輸入涝桅,會得到更好的結(jié)果拜姿,如下圖所示:
卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是一種前饋神經(jīng)網(wǎng)絡(luò),它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元冯遂,對于大型圖像處理有出色表現(xiàn)蕊肥。
卷積神經(jīng)網(wǎng)絡(luò)由一個或多個卷積層和頂端的全連通層(對應(yīng)經(jīng)典的神經(jīng)網(wǎng)絡(luò))組成,同時也包括關(guān)聯(lián)權(quán)重和池化層(pooling layer)蛤肌。這一結(jié)構(gòu)使得卷積神經(jīng)網(wǎng)絡(luò)能夠利用輸入數(shù)據(jù)的二維結(jié)構(gòu)壁却。與其他深度學(xué)習結(jié)構(gòu)相比批狱,卷積神經(jīng)網(wǎng)絡(luò)在圖像和語音識別方面能夠給出更好的結(jié)果。這一模型也可以使用反向傳播算法進行訓(xùn)練儒洛。相比較其他深度精耐、前饋神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)需要考量的參數(shù)更少琅锻,使之成為一種頗具吸引力的深度學(xué)習結(jié)構(gòu)卦停。
修改我的架構(gòu),使用卷積神經(jīng)網(wǎng)絡(luò)來解決同一個問題恼蓬,得到結(jié)果如下圖所示:
所得結(jié)果大為改善惊完。但最好的結(jié)果還在后頭。
長短期記憶網(wǎng)絡(luò)
長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory处硬, LSTM)是一種時間遞歸神經(jīng)網(wǎng)絡(luò) (RNN)小槐,論文首次發(fā)表于 1997 年。由于獨特的設(shè)計結(jié)構(gòu)荷辕,LSTM 適合于處理和預(yù)測時間序列中間隔和延遲非常長的重要事件凿跳。
LSTM 的表現(xiàn)通常比時間遞歸神經(jīng)網(wǎng)絡(luò)及隱馬爾科夫模型(HMM)更好,比如用在不分段連續(xù)手寫識別上疮方。2009 年控嗜,用 LSTM 構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)模型贏得過 ICDAR 手寫識別比賽冠軍。LSTM 還普遍用于自主語音識別骡显,2013 年運用 TIMIT 自然演講數(shù)據(jù)庫達成 17.7% 錯誤率的紀錄疆栏。作為非線性模型,LSTM 可作為復(fù)雜的非線性單元用于構(gòu)造更大型深度神經(jīng)網(wǎng)絡(luò)惫谤。
使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變種后壁顶,我得到結(jié)果如下所示:
因此,整體來說均方誤差的趨勢出乎意料溜歪。
投資組合構(gòu)建
我們嘗試使用深度學(xué)習解決的第二個金融問題是投資組合構(gòu)建若专。在這個問題上,深度學(xué)習的實際應(yīng)用效果很好蝴猪。我的研究靈感來自這篇論文:《深度投資組合》(https://0x9.me/8uOBt)
這篇論文的作者嘗試構(gòu)建自動編碼器调衰,將時間序列映射到自身。使用這些自動編碼器的預(yù)測誤差成為股票測試版(與市場相關(guān))的代用指標拯腮,自動編碼器用作市場的模型窖式。
自動編碼器(auto-encoder),是一種無監(jiān)督的學(xué)習算法动壤,主要用于數(shù)據(jù)的降維或者特征的抽取萝喘,在深度學(xué)習中,自動編碼器可用于在訓(xùn)練階段開始前,確定權(quán)重矩陣 W 的初始值阁簸∨涝纾基于上述自動編碼器的誤差選擇不同的股票,我們可以使用另一個深度神經(jīng)網(wǎng)絡(luò)來構(gòu)建深度指標启妹,結(jié)果相當不錯筛严,如下圖所示:
深度神經(jīng)網(wǎng)絡(luò)已成為利用股票復(fù)制指數(shù)的指數(shù)構(gòu)建方法。
但這只是它的開始饶米!如果我們應(yīng)用智能索引桨啃,在我去掉指數(shù)的極端下降期,并在智能索引上訓(xùn)練我的指數(shù)映射深度神經(jīng)網(wǎng)絡(luò)時檬输,我就能以驚人的速度超過指數(shù)照瘾!
這種技術(shù)在證券投資組合領(lǐng)域有著巨大的潛力!
結(jié)論
目前金融業(yè)的趨勢是朝更復(fù)雜丧慈、更健全的的模式發(fā)展析命。隨著大量數(shù)據(jù)科學(xué)家涌入該行業(yè),對所有銀行來說逃默,技術(shù)是一個巨大的壓力鹃愤。像 RelTec、Worldquant 這樣的對沖基金完域,在其交易中已經(jīng)使用這種技術(shù)软吐。由于這些復(fù)雜模型在其他領(lǐng)域所表現(xiàn)出的優(yōu)異結(jié)果,以及在金融建模領(lǐng)域的巨大差距筒主,將會有一系列的戲劇性的創(chuàng)新涌現(xiàn)关噪!
更好地解決金融和貿(mào)易領(lǐng)域的關(guān)鍵問題鸟蟹,將會提高效率乌妙、提高透明度、加強風險管理和新的創(chuàng)新建钥。
譯者感言
深度學(xué)習的一大優(yōu)勢在于可以大幅減少人工參與的特征工程去“擬合”訓(xùn)練數(shù)據(jù)藤韵,但這也不是說完全不需要人去參與特征的選取,尤其是金融市場熊经,數(shù)據(jù)簡直是海量泽艘,并且大都高噪聲,非穩(wěn)定镐依,所以除非你能夠清楚哪些數(shù)據(jù)具有潛在價值匹涮、如何做適當?shù)念A(yù)處理和如何轉(zhuǎn)化并達成哪些目標,否則深度學(xué)習在金融領(lǐng)域是無法應(yīng)用的槐壳。
如果設(shè)計得當然低,增加神經(jīng)網(wǎng)絡(luò)的深度可以對更復(fù)雜的模式進行映射,因此可對金融數(shù)據(jù)的訓(xùn)練產(chǎn)生更好效果。
例如 CNN 適合處理圖像一類的大數(shù)據(jù)雳攘,不一定直接適用于金融數(shù)據(jù)带兜。金融數(shù)據(jù)雖然也可以很大,但通常不在一個數(shù)量級上——一幅圖像中的樣本數(shù)(像素吨灭、顏色)很容易上百萬刚照,要訓(xùn)練一個模型又要用到成千上萬個圖像,為了找到高效辦法提取特征喧兄,于是計算機科學(xué)家想出了卷積神經(jīng)網(wǎng)絡(luò)通過抽取特征值來簡化運算復(fù)雜度无畔。而我們處理的金融時間序列數(shù)據(jù),單組樣本的數(shù)量常在百萬以下吠冤,規(guī)模上往往不需要卷積檩互。進一步比較,相對于金融數(shù)據(jù)咨演,圖像識別的特點是數(shù)據(jù)量龐大闸昨、特征明顯、特征重復(fù)次數(shù)多薄风、特征組合性強饵较、出現(xiàn)的次序性、特征呈現(xiàn)的方向性有時不強遭赂,這與金融數(shù)據(jù)噪音大循诉、數(shù)量較小的特點有所不同。因此撇他,在訓(xùn)練金融數(shù)據(jù)時很有必要設(shè)計有針對性的深度機器學(xué)習模型茄猫。
本文涉及到的代碼可在作者的 GitHub Repo 中找到
https://0x9.me/P5ahd
原文鏈接
https://medium.com/towards-data-science/deep-learning-in-finance-9e088cb17c03
-全文完-
關(guān)注人工智能的落地實踐,與企業(yè)一起探尋 AI 的邊界困肩,AICon 全球人工智能技術(shù)大會火熱售票中划纽,8 折倒計時一周搶票,詳情點擊:
https://aicon.geekbang.org/?utm_source=ai-front&utm_medium=zhihu
《深入淺出TensorFlow》迷你書現(xiàn)已發(fā)布锌畸,關(guān)注公眾號“AI前線”勇劣,ID:ai-front,回復(fù)關(guān)鍵字:TF潭枣,獲取下載鏈接比默!