因為我是大氣科學專業(yè)的嘱兼,對于預測時間序列所要用的神經(jīng)網(wǎng)絡的理解有限悦冀,但是對ENSO的成因安吁,影響機制有一定的了解醉蚁。因此,這里不從技術角度出發(fā)鬼店,而是從一篇《Nature》上的文章出發(fā)网棍,講一講此次比賽可能用到的機器學習的方法,以及如何利用此次比賽提供的數(shù)據(jù) (SST, T300, Ua, Va)妇智。
希望這篇文章能給看到的同學一些啟發(fā)滥玷,但不希望你們的思路被這篇文章局限住。
因為湊巧之前聽了Jing-Jia Luo 老師的一個學術報告巍棱,得知這次比賽主要是他推動發(fā)起的惑畴,并且是基于以下這篇和其他兩位作者合作的文章—'Deep learning for multi-year ENSO forecasts'。文章挺長航徙,且里面涉及到很多專業(yè)名詞和知識如贷,看起來會比較繁瑣。下面捉偏,我主要對這篇文章中用來預測時間序列的方法進行概括倒得。(下文所用到的圖片全部來自這篇文章)
作者進行ENSO預測選用的是卷積神經(jīng)網(wǎng)絡 (CNN),原因是CNN在處理具有空間結構的多維數(shù)組的數(shù)據(jù)方面成果顯著(例如夭禽,識別彩圖中的物體)霞掺。因此,CNN也適用于揭示三維預測場(這里可以是過去12個月的SST空間分布場, T300空間分布場讹躯,Ua, Va空間分布場)與需要預測的指數(shù)(這里是未來1-24個月的Nino3.4指數(shù))之間的聯(lián)系菩彬。
文中的CNN模型采用連續(xù)3個月0°–360°?E, 55°?S–60°?N范圍內(nèi)的 SST 和 T300 相對于氣候平均的異常值作為預測因子(predictor),Nino3.4指數(shù)作為預報量(predictand)潮梯。(關于為什么作者沒有將Ua骗灶,Va也作為預報因子,作者在之前的一個學術報告里也提過:在他搭建的模型中秉馏,不使用Ua, Va耙旦,而僅用SST和T300得到的預測結果更好。但是我們可以考慮將Ua, Va也作為預測因子萝究,起碼可以嘗試一下免都。)
事實上,真正通過觀測所得的數(shù)據(jù)只有再分析資料(也就是比賽提供的SODA_train.nc 和SODA_label.nc帆竹,因為真正有氣象觀測大概是1871年開始)绕娘。但我們知道,訓練神經(jīng)網(wǎng)絡這點數(shù)據(jù)量是不夠的栽连。因此险领,才有了CMIP5和CMIP6數(shù)據(jù)(這里提一下侨舆,文中作者只用了CMIP5的數(shù)據(jù),CMIP6數(shù)據(jù)應該是后來模式(此模式非彼模式绢陌,CMIP5, CMIP6是一系列動力模式的集合挨下,簡而言之就是用現(xiàn)在已有的數(shù)據(jù)經(jīng)過一系列物理方程推導得出未來可能的結果)跑出來得到的數(shù)據(jù),然后提供給我們)下面。但由于CMIP_label.nc 中的數(shù)據(jù)是氣候模式跑出來的复颈,所以并不是完全準確,也就是說不能完全反映我們現(xiàn)實中的氣候狀況沥割。因此文章中作者應用遷移學習的概念耗啦,先用CMIP跑出來的數(shù)據(jù)(CMIP_train.nc)來訓練CNN模型,并將訓練后的權重作為初始權重机杜,用再分析數(shù)據(jù)(SODA_train.nc)接著訓練帜讲,這樣得到最終的CNN模型。CNN模型中的系統(tǒng)誤差反應了CMIP數(shù)據(jù)中的系統(tǒng)誤差椒拗,這在第二次用觀測數(shù)據(jù)進行訓練后得到了一定的修正似将。
本文作者不僅訓練了CNN,還嘗試了前饋神經(jīng)網(wǎng)絡 (NN)蚀苛。文中對NN沒有介紹在验,但給出了 CNN 和 NN 的預測效果對比,如下圖所示堵未。從圖中可以看出腋舌,將CNN作為模型進行預測所得的結果比NN要好很多。
總的來說渗蟹,用CNN做Nino3.4指數(shù)的預測比氣候動力模式和NN都要好块饺。因為CNN通過卷積過程成功提取了輸入變量中的特征。此外雌芽,卷積過程允許CNN模型使用相對較少的氣候樣本進行訓練授艰。
下圖是這篇文章中Method一節(jié),其中主要介紹了搭建該CNN時的諸多細節(jié)世落,這一節(jié)中涉及到的氣象方面的專業(yè)知識較少淮腾,感興趣的可以讀一下。