Baseline學習及改進

因為我是大氣科學專業(yè)的嘱兼,對于預測時間序列所要用的神經(jīng)網(wǎng)絡的理解有限悦冀,但是對ENSO的成因安吁,影響機制有一定的了解醉蚁。因此,這里不從技術角度出發(fā)鬼店,而是從一篇《Nature》上的文章出發(fā)网棍,講一講此次比賽可能用到的機器學習的方法,以及如何利用此次比賽提供的數(shù)據(jù) (SST, T300, Ua, Va)妇智。

希望這篇文章能給看到的同學一些啟發(fā)滥玷,但不希望你們的思路被這篇文章局限住。

因為湊巧之前聽了Jing-Jia Luo 老師的一個學術報告巍棱,得知這次比賽主要是他推動發(fā)起的惑畴,并且是基于以下這篇和其他兩位作者合作的文章—'Deep learning for multi-year ENSO forecasts'。文章挺長航徙,且里面涉及到很多專業(yè)名詞和知識如贷,看起來會比較繁瑣。下面捉偏,我主要對這篇文章中用來預測時間序列的方法進行概括倒得。(下文所用到的圖片全部來自這篇文章)


作者進行ENSO預測選用的是卷積神經(jīng)網(wǎng)絡 (CNN),原因是CNN在處理具有空間結構的多維數(shù)組的數(shù)據(jù)方面成果顯著(例如夭禽,識別彩圖中的物體)霞掺。因此,CNN也適用于揭示三維預測場(這里可以是過去12個月的SST空間分布場, T300空間分布場讹躯,Ua, Va空間分布場)與需要預測的指數(shù)(這里是未來1-24個月的Nino3.4指數(shù))之間的聯(lián)系菩彬。


文中的CNN模型采用連續(xù)3個月0°–360°?E, 55°?S–60°?N范圍內(nèi)的 SST 和 T300 相對于氣候平均的異常值作為預測因子(predictor),Nino3.4指數(shù)作為預報量(predictand)潮梯。(關于為什么作者沒有將Ua骗灶,Va也作為預報因子,作者在之前的一個學術報告里也提過:在他搭建的模型中秉馏,不使用Ua, Va耙旦,而僅用SST和T300得到的預測結果更好。但是我們可以考慮將Ua, Va也作為預測因子萝究,起碼可以嘗試一下免都。)

事實上,真正通過觀測所得的數(shù)據(jù)只有再分析資料(也就是比賽提供的SODA_train.nc 和SODA_label.nc帆竹,因為真正有氣象觀測大概是1871年開始)绕娘。但我們知道,訓練神經(jīng)網(wǎng)絡這點數(shù)據(jù)量是不夠的栽连。因此险领,才有了CMIP5和CMIP6數(shù)據(jù)(這里提一下侨舆,文中作者只用了CMIP5的數(shù)據(jù),CMIP6數(shù)據(jù)應該是后來模式(此模式非彼模式绢陌,CMIP5, CMIP6是一系列動力模式的集合挨下,簡而言之就是用現(xiàn)在已有的數(shù)據(jù)經(jīng)過一系列物理方程推導得出未來可能的結果)跑出來得到的數(shù)據(jù),然后提供給我們)下面。但由于CMIP_label.nc 中的數(shù)據(jù)是氣候模式跑出來的复颈,所以并不是完全準確,也就是說不能完全反映我們現(xiàn)實中的氣候狀況沥割。因此文章中作者應用遷移學習的概念耗啦,先用CMIP跑出來的數(shù)據(jù)(CMIP_train.nc)來訓練CNN模型,并將訓練后的權重作為初始權重机杜,用再分析數(shù)據(jù)(SODA_train.nc)接著訓練帜讲,這樣得到最終的CNN模型。CNN模型中的系統(tǒng)誤差反應了CMIP數(shù)據(jù)中的系統(tǒng)誤差椒拗,這在第二次用觀測數(shù)據(jù)進行訓練后得到了一定的修正似将。

本文作者不僅訓練了CNN,還嘗試了前饋神經(jīng)網(wǎng)絡 (NN)蚀苛。文中對NN沒有介紹在验,但給出了 CNN 和 NN 的預測效果對比,如下圖所示堵未。從圖中可以看出腋舌,將CNN作為模型進行預測所得的結果比NN要好很多。


總的來說渗蟹,用CNN做Nino3.4指數(shù)的預測比氣候動力模式和NN都要好块饺。因為CNN通過卷積過程成功提取了輸入變量中的特征。此外雌芽,卷積過程允許CNN模型使用相對較少的氣候樣本進行訓練授艰。

下圖是這篇文章中Method一節(jié),其中主要介紹了搭建該CNN時的諸多細節(jié)世落,這一節(jié)中涉及到的氣象方面的專業(yè)知識較少淮腾,感興趣的可以讀一下。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末屉佳,一起剝皮案震驚了整個濱河市来破,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌忘古,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诅诱,死亡現(xiàn)場離奇詭異髓堪,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進店門干旁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來驶沼,“玉大人,你說我怎么就攤上這事争群』亓” “怎么了?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵换薄,是天一觀的道長玉雾。 經(jīng)常有香客問我,道長轻要,這世上最難降的妖魔是什么复旬? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮冲泥,結果婚禮上驹碍,老公的妹妹穿的比我還像新娘。我一直安慰自己凡恍,他們只是感情好志秃,可當我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著嚼酝,像睡著了一般浮还。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上革半,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天碑定,我揣著相機與錄音,去河邊找鬼又官。 笑死延刘,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的六敬。 我是一名探鬼主播碘赖,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼外构!你這毒婦竟也來了普泡?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤审编,失蹤者是張志新(化名)和其女友劉穎撼班,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體垒酬,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡砰嘁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年件炉,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片矮湘。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡斟冕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出缅阳,到底是詐尸還是另有隱情磕蛇,我是刑警寧澤,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布十办,位于F島的核電站秀撇,受9級特大地震影響,放射性物質發(fā)生泄漏橘洞。R本人自食惡果不足惜捌袜,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望炸枣。 院中可真熱鬧虏等,春花似錦、人聲如沸适肠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽侯养。三九已至敦跌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間逛揩,已是汗流浹背柠傍。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留辩稽,地道東北人惧笛。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像逞泄,于是被迫代替她去往敵國和親患整。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容