天池-AI earth人工智能創(chuàng)新挑戰(zhàn)賽第4名方案和代碼

原文發(fā)表于:數(shù)據(jù)競(jìng)賽:厄爾尼諾預(yù)測(cè)第5名方案和代碼
歡迎關(guān)注微信公眾號(hào):YueTan

image

背景

照例先感謝國家,國家提倡就地過年抄瑟、沒讓回家,只好找個(gè)有意思的事情庆冕、才找了這個(gè)比賽做的。過年期間就是一邊循環(huán)播放三體、一拳超人、賭博默示錄匙握,另一邊就一直做比賽,大概累計(jì)出門了兩次陈轿。年夜飯:

image

對(duì)于下一次認(rèn)真參加的比賽圈纺,想找個(gè)能穩(wěn)定線下驗(yàn)證的。認(rèn)真參加了兩個(gè)比賽麦射,都抖蛾娶,反而靠運(yùn)氣連拿兩個(gè)獎(jiǎng)杯,終究不是長久之計(jì)啊潜秋。

Roadmap

小故事:大年初一那天蛔琅,開始第一次嘗試提交,當(dāng)天還在論壇里寫了一篇docker提交錯(cuò)誤的總結(jié)和應(yīng)對(duì)峻呛,那篇帖子的最后我說接下來去研究時(shí)間序列模型了罗售,給了兩個(gè)參考鏈接就有我最終使用的模型,當(dāng)時(shí)的我真的沒有想到钩述,其中的一個(gè)模型竟然那么有用寨躁。

image
  • 方案一:使用24個(gè)LightGBM模型來分別預(yù)測(cè)未來24個(gè)月的指數(shù)。A榜最高分?jǐn)?shù): -20
  • 方案二:時(shí)空預(yù)測(cè)模型牙勘,應(yīng)用ConvLSTM等時(shí)空信息职恳,依據(jù)空間和時(shí)間信息來預(yù)測(cè)未來,主要就是在baseline基礎(chǔ)上進(jìn)一步優(yōu)化方面。A榜最高分?jǐn)?shù):32
  • 方案三:時(shí)間序列模型放钦,利用dynamic decoding的方式分別預(yù)測(cè)24個(gè)月的值。A榜最高分?jǐn)?shù):39恭金,B榜第一次提交時(shí)的分?jǐn)?shù)41.97操禀,最后排行榜可以排第8,優(yōu)化后的最終方案也就是最終成績排第5

方案介紹

答辯現(xiàn)場(chǎng)聽下來蔚叨,我的模型是最簡單的床蜘,用簡單模型大概是我做數(shù)據(jù)挖掘留下的職業(yè)病。線上訓(xùn)練加預(yù)測(cè)只有半小時(shí)蔑水,應(yīng)該也是最快的。嘛時(shí)候能做到最簡單扬蕊、最快搀别、效果還最好才是最終目標(biāo)。

image

數(shù)據(jù)上主要有效的操作一個(gè)是采樣尾抑,一個(gè)是截?cái)嘈浮:苓z憾的是雖然我很喜歡PPT上說為什么進(jìn)行這個(gè)采樣頻率蒂培,但實(shí)際我是先做了采樣,后面在寫PPT的時(shí)候才想起來把這兩件事關(guān)聯(lián)起來的榜苫,算是一個(gè)構(gòu)造的故事护戳。

image
image

特征主要來自氣象和時(shí)間特征,PPT上很清楚了垂睬,也可以看代碼媳荒。

image

月份信息對(duì)于預(yù)測(cè)很關(guān)鍵,可以看出每個(gè)月指標(biāo)增加或減小的分布并不相同驹饺。dynamic decoding的方式有用的關(guān)鍵一環(huán)也可能是可以加入月份信息钳枕。

image
image

我對(duì)于數(shù)據(jù)的選取其實(shí)不夠robust,但A榜和B榜本身卻很穩(wěn)定赏壹,可能是運(yùn)氣好吧鱼炒。以前學(xué)力學(xué)的時(shí)候,一個(gè)俄國人開創(chuàng)了一門新的分支蝌借,關(guān)于穩(wěn)定平衡與不穩(wěn)定平衡的研究昔瞧,我覺得自己這里就不穩(wěn)定。發(fā)生在這個(gè)比賽里菩佑,我是不相信每次我初始選擇的幾個(gè)參數(shù)恰好就是局部最優(yōu)的硬爆,但關(guān)于數(shù)據(jù)的選取上,不管增大或減小都會(huì)降分擎鸠。

image

答辯完缀磕,和大家吃了個(gè)飯就去玄武湖公園了,劃了一個(gè)小時(shí)船后火車回了劣光。

未解之謎

數(shù)據(jù)是一個(gè)實(shí)驗(yàn)學(xué)科袜蚕,還是應(yīng)該多嘗試的。中間我想嘗試teacher forcing和sample scheduling的時(shí)候绢涡,只嘗試了teacher forcing后降分了牲剃,就沒嘗試sample scheduling了,從幾個(gè)隊(duì)伍的表現(xiàn)來看這個(gè)是有用的雄可。另外我對(duì)框架從pytorch換成tensorflow這個(gè)降分點(diǎn)凿傅,一直沒弄明白。

最后:

代碼開源如下:https://github.com/LongxingTan/Data-competitions/tree/master/tianchi-enso-prediction

后記:

發(fā)現(xiàn)了我前面有人作弊数苫,一下?lián)p失好多錢:https://www.zhihu.com/question/4357

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末聪舒,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子虐急,更是在濱河造成了極大的恐慌箱残,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,290評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異被辑,居然都是意外死亡燎悍,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門盼理,熙熙樓的掌柜王于貴愁眉苦臉地迎上來谈山,“玉大人,你說我怎么就攤上這事宏怔∽嗦罚” “怎么了?”我有些...
    開封第一講書人閱讀 156,872評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵举哟,是天一觀的道長思劳。 經(jīng)常有香客問我,道長妨猩,這世上最難降的妖魔是什么潜叛? 我笑而不...
    開封第一講書人閱讀 56,415評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮壶硅,結(jié)果婚禮上威兜,老公的妹妹穿的比我還像新娘。我一直安慰自己庐椒,他們只是感情好椒舵,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,453評(píng)論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著约谈,像睡著了一般笔宿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上棱诱,一...
    開封第一講書人閱讀 49,784評(píng)論 1 290
  • 那天泼橘,我揣著相機(jī)與錄音,去河邊找鬼迈勋。 笑死炬灭,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的靡菇。 我是一名探鬼主播重归,決...
    沈念sama閱讀 38,927評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼厦凤!你這毒婦竟也來了鼻吮?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,691評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤泳唠,失蹤者是張志新(化名)和其女友劉穎狈网,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體笨腥,經(jīng)...
    沈念sama閱讀 44,137評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拓哺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,472評(píng)論 2 326
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了脖母。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片士鸥。...
    茶點(diǎn)故事閱讀 38,622評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖谆级,靈堂內(nèi)的尸體忽然破棺而出烤礁,到底是詐尸還是另有隱情,我是刑警寧澤肥照,帶...
    沈念sama閱讀 34,289評(píng)論 4 329
  • 正文 年R本政府宣布脚仔,位于F島的核電站,受9級(jí)特大地震影響舆绎,放射性物質(zhì)發(fā)生泄漏鲤脏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,887評(píng)論 3 312
  • 文/蒙蒙 一吕朵、第九天 我趴在偏房一處隱蔽的房頂上張望猎醇。 院中可真熱鬧,春花似錦努溃、人聲如沸硫嘶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽沦疾。三九已至,卻和暖如春第队,著一層夾襖步出監(jiān)牢的瞬間哮塞,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國打工斥铺, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留彻桃,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,316評(píng)論 2 360
  • 正文 我出身青樓晾蜘,卻偏偏與公主長得像邻眷,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子剔交,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,490評(píng)論 2 348