我17年開始參加天池大賽,玩天池一半是為了練習(xí)機(jī)器學(xué)習(xí),一半是消遣撞蜂。因為工作魁莉、家庭的事情都很多,時間很難保證舱权,為了不坑隊友矗晃,所以到現(xiàn)在比賽都是SOLO,自娛自樂宴倍。因為可用時間少张症,又是一個人SOLO,所以閉門造車鸵贬、走到溝里出不來也都是常有的事俗他。
第一個比賽是IJCAI-17 口碑商家客流量預(yù)測,那個時候剛好看了時序的一些東西阔逼,覺得R語言的Auto.Arima很不錯兆衅,于是就把R語言關(guān)于時序的包都調(diào)了一個遍,然后又是一頓亂七八糟的融合嗜浮。我的筆記本配置不好涯保,跑Arima溫度都高的不行,正好我當(dāng)時還有一個1C2G的ECS(半年試用送的)周伦,我決定就是它了夕春。于是在這個虛機(jī)上裝了R和Python的環(huán)境,在上面跑各種算法专挪,很長一段時間這個虛機(jī)的CPU一直是100%及志。而且這個比賽,因為一直沒有走到正路上寨腔,所以結(jié)果也就毫無懸念的撲街了速侈。
第二個比賽是阿里聚安全算法挑戰(zhàn)賽,因為是平臺賽迫卢,不用自己的計算資源倚搬,而且主要的處理界面都是跑的SQL,所以玩的十分快樂乾蛤,最后總成績35名每界。
第三個好像是CIKM捅僵,當(dāng)時在看了題目,并用Python把云圖畫出來之后眨层,我覺得這個應(yīng)該用卷積神經(jīng)網(wǎng)絡(luò)來做庙楚,可以先按照圖像處理一下∨坑#可是我只有一個破筆記本馒闷,沒有什么GPU,只好用傳統(tǒng)算法一頓瞎做叁征,又撲街了纳账。
然后因為比較忙,所以后面的幾個比賽都是打醬油了捺疼,基本上都是扔了一個成績就走的疏虫。
2018年初參加了阿里聚安全算法挑戰(zhàn)賽,具體解題思路帅涂,可以看一下我的這個帖子: https://tianchi.aliyun.com/forum/new_articleDetail.html?from=user&raceId=&postsId=3062 可能是因為題目比較適合我吧议薪,經(jīng)過初賽,復(fù)賽媳友,24小時決賽斯议,最后得了一個季軍(三等獎),這是我第一次得獎醇锚,當(dāng)時非常高興哼御。
感覺像是捅破了窗戶紙,后續(xù)參加的比賽就開始陸續(xù)得獎了焊唬,在后續(xù)的比賽中得過3個亞軍恋昼,2個季軍,幾個top5赶促,現(xiàn)在在40萬天池選手中積分排第9液肌。
我其實每個比賽投入的精力都比較有限,對如何用非常有限的時間和精力取得較好成績鸥滨,我有一些不算是經(jīng)驗的經(jīng)驗吧嗦哆,放在這算是拋磚引玉吧。
1婿滓,理解業(yè)務(wù)老速、數(shù)據(jù),科學(xué)的數(shù)據(jù)可視化處理對于理解數(shù)據(jù)有很大的幫助凸主。
2橘券,抓住要點(diǎn),建立基線,快速迭代旁舰。再復(fù)雜的問題總有一些簡單的處理方法锋华,先把它做出來,投石問路鬓梅。
3供置,查找資料谨湘,借鑒前人經(jīng)驗绽快。
4,做好規(guī)劃紧阔,合理安排時間坊罢,長短期結(jié)合,多種方案擅耽、模型并行
5活孩,前期要腦洞大開,多多嘗試乖仇。后期要精細(xì)打磨憾儒,精益求精。
6乃沙,整理文檔起趾,做好記錄,磨刀不誤砍柴工警儒,做好總結(jié)训裆,不斷提升。
7蜀铲,在總結(jié)之外還有分享边琉,交流,分享记劝、交流在幫助別人的同時也可以讓自己更快变姨、更加深入的掌握這項技術(shù)。
8厌丑,最后是由一個好的心態(tài)定欧,成績不論如何,自己有學(xué)到新東西蹄衷,自己開心就好忧额。