An Interpretable and Sparse Neural Network Model for Nonlinear Granger Causality Discovery翻譯
個(gè)人學(xué)習(xí)筆記钉蒲,轉(zhuǎn)載參考請(qǐng)注明出處
摘要
雖然大多數(shù)經(jīng)典的格蘭杰因果關(guān)系檢測方法依賴于線性時(shí)間序列假設(shè),但神經(jīng)科學(xué)和經(jīng)濟(jì)學(xué)應(yīng)用中的許多交互作用是非線性的顷啼。我們發(fā)展了一種使用多層感知器的非線性格蘭杰因果關(guān)系檢測方法,其中網(wǎng)絡(luò)的輸入是所有序列的過去時(shí)間滯后钙蒙,輸出是單個(gè)序列的未來值。在這種情況下躬厌,Granger非因果關(guān)系的一個(gè)充分條件是,輸入數(shù)據(jù)的所有輸出權(quán)重(序列的過去滯后)到第一個(gè)隱藏層都為零偏陪。對(duì)于估計(jì),我們使用一組套索懲罰將輸入權(quán)重組縮小為零笛谦。我們還提出了一個(gè)等級(jí)懲罰同時(shí)格蘭杰因果關(guān)系和滯后估計(jì)昌阿。我們?cè)谙∈杈€性自回歸模型和稀疏非線性Lorenz-96模型的模擬數(shù)據(jù)上驗(yàn)證了我們的方法饥脑。
介紹
格蘭杰因果關(guān)系量化了一個(gè)時(shí)間序列的過去活動(dòng)對(duì)另一個(gè)時(shí)間序列的預(yù)測程度。當(dāng)研究一個(gè)完整的時(shí)間序列系統(tǒng)時(shí)谣沸,相互作用網(wǎng)絡(luò)可能會(huì)被發(fā)現(xiàn)[2]。經(jīng)典上乳附,估計(jì)格蘭杰因果關(guān)系的大多數(shù)方法假設(shè)線性時(shí)間序列動(dòng)力學(xué)伴澄,并使用流行的向量自回歸(VAR)模型[9,8]赋除。然而非凌,在許多現(xiàn)實(shí)世界的時(shí)間序列中,序列之間的依賴是非線性的敞嗡,使用線性模型可能導(dǎo)致格蘭杰因果相互作用的不一致估計(jì)[12,13]。估計(jì)時(shí)間序列中相互作用的常見非線性方法使用加法模型[12,4,11]喉悴,其中每個(gè)序列的過去可能有一個(gè)相加的非線性效應(yīng),在序列之間解耦婚脱。然而,加性模型可能會(huì)忽略預(yù)測因子之間重要的非線性相互作用起惕,因此也可能無法檢測到重要的Granger因果關(guān)系咏删。
為了解決這些挑戰(zhàn)惹想,我們提出了一個(gè)框架督函,以解釋非線性格蘭杰因果關(guān)系發(fā)現(xiàn)使用正則化神經(jīng)網(wǎng)絡(luò)。用于時(shí)間序列分析的神經(jīng)網(wǎng)絡(luò)模型傳統(tǒng)上只用于預(yù)測和預(yù)測辰狡,而不用于解釋。這是因?yàn)橥鹌捎陔[藏層中相互作用的節(jié)點(diǎn)錯(cuò)綜復(fù)雜,輸入的影響難以精確量化偷卧。我們避開了這個(gè)困難豺瘤,而是構(gòu)建了一個(gè)簡單的體系結(jié)構(gòu)听诸,允許我們精確地選擇對(duì)輸出沒有線性或非線性影響的時(shí)間序列。
我們將最近關(guān)于神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)選擇稀疏誘導(dǎo)懲罰的研究[1,7]應(yīng)用到我們的案例中晌梨。特別是,我們通過在輸入的輸出權(quán)重上添加一組套索懲罰[14]來選擇格蘭杰因果關(guān)系仔蝌,我們稱之為編碼選擇。我們還探討了一種自動(dòng)滯后選擇的分層套索懲罰[10]师逸。當(dāng)真實(shí)的非線性相互作用網(wǎng)絡(luò)是稀疏的時(shí)司倚,該方法將選取Granger引起的輸出序列和這些相互作用的滯后的幾個(gè)時(shí)間序列