剛完成Udacity的Deep Learning課程,迫不及待想要實(shí)戰(zhàn)了镐牺!
經(jīng)過這幾個(gè)月的學(xué)習(xí)睬涧,深知這幾方面亟待提高:
- RNN旗唁,Seq2seq, word2vec, GAN的理解程度。
- 對(duì)TensorFlow API的底層數(shù)學(xué)原理宅粥,API調(diào)用的準(zhǔn)確度秽梅。
- Python里numpy, sklearn, scipy等對(duì)高維數(shù)據(jù)的處理剿牺,主要庫(kù)的調(diào)用熟練度。
- 另外theano停更了钞诡,似乎有必要再了解一下Pytorch、Caffe接箫。
知而不行只是未知
實(shí)戰(zhàn)出真知辛友,好的項(xiàng)目目前來看最缺乏的恰恰是數(shù)據(jù)剪返,近來最吸引我的項(xiàng)目莫過于OpenAI推出的Dota2 1v1 bot脱盲,用Reinforcement Learning訓(xùn)練3周,即可連續(xù)擊敗世界級(jí)solo選手驼修。很期待OpenAI團(tuán)隊(duì)真的能夠拿出5v5模型诈铛!
參加比賽與我而言幢竹,價(jià)值有二恩静,一方面是能低成本的獲取到大數(shù)據(jù)驶乾,另一方面是檢驗(yàn)所學(xué)。之前一直有關(guān)注kaggle里的Predict seizures in intracranial EEG recordings比賽疙咸。不過9月推出的AI Challenger更加本土化风科,涵蓋了“翻譯”贼穆、“場(chǎng)景分類”、“關(guān)鍵點(diǎn)檢測(cè)”顶瞳、“圖文描述”、“股票預(yù)測(cè)”慨菱。
鑒于第一次抡柿,我的目的很明確:
- Participating is more important than winning!
- 檢驗(yàn)Deep Learning的學(xué)習(xí)內(nèi)容。
- 邊實(shí)戰(zhàn)邊加快Data Analysis的進(jìn)度备蚓,清洗數(shù)據(jù)很重要囱稽,甚至占據(jù)了整個(gè)項(xiàng)目超過50%的精力战惊!
以“場(chǎng)景分類”項(xiàng)目為例,打算分為四步走:
- 解壓况凉,讀取各拷,尺寸變換烤黍,歸一化圖像數(shù)據(jù),建立3-4層卷積神經(jīng)網(wǎng)絡(luò)速蕊。按照評(píng)價(jià)標(biāo)準(zhǔn)先觀察一下accuracy的情況闪萄。
- 讀引用里的三篇paper枣购,找出優(yōu)化思路。LSUN初讀了下,似乎是關(guān)于human labeling的內(nèi)容赊时。
- LSUN: Construction of a Large-Scale Image Dataset using Deep Learning with Humans in the Loop
- Places: A 10 million Image Database for Scene Recognition
- SUN Database: Large-scale Scene Recognition from Abbey to Zoo
- 讀Dog-classification的算法缸浦,看看有無啟發(fā)划提。
- 與朋友探討并重構(gòu)優(yōu)化崔涂。
[題外話]原本以為完成課程僅需2-3個(gè)月,結(jié)果花了整整5個(gè)月糊秆,中途甚至有過迷茫武福。身邊較少有朋友從事AI痘番、機(jī)器學(xué)習(xí)的工作或者科研捉片,尚缺乏燈塔式的人物平痰,現(xiàn)在想來支撐自己的是“堅(jiān)持”和親朋好友的“理解”。
致朋友們的話:我很好伍纫,感謝大家的關(guān)心宗雇!在看待事業(yè)與工作的問題上,我只不過在這個(gè)能折騰的年紀(jì)不愿意因循守舊而已莹规。堅(jiān)信AI是方向赔蒲,未來會(huì)更好!