一個自然語言處理煉丹師的自白
往期:
因為各種媒體宣傳谷徙,最近問問學(xué)校新入學(xué)計算機科學(xué)的學(xué)生們,想搞什么研究,結(jié)果十個里有九個要研究機器學(xué)習(xí),中間還一些弄不清深度學(xué)習(xí)和機器學(xué)習(xí)的關(guān)系,實際上是想搞深度學(xué)習(xí)。
原本深度學(xué)習(xí)(深度神經(jīng)網(wǎng)絡(luò))只是機器學(xué)習(xí)領(lǐng)域一個分支,但因為其最近大火,導(dǎo)致對整個領(lǐng)域出現(xiàn)了這樣的劃分:深度的和非深度汗销,或者說深度的和傳統(tǒng)的。雖然現(xiàn)在自然語言處理研究主要用深度學(xué)習(xí)抵窒,但因為很多概念來自機器學(xué)習(xí)弛针,還是有必要了解傳統(tǒng)機器學(xué)習(xí)的。而且如最近周志華提出的深度森林李皇,將其他傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)的理念結(jié)合起來削茁,就可以提出一些很有意思的模型。
下面大概根據(jù)難度將學(xué)習(xí)資料列出來。
入門
最開始想簡單了解一下付材,那么第一步朦拖,可以只將 Goodfellow 的 Deep Learning 前面介紹小節(jié)讀一下,第四小節(jié)的 Numerical Computations 以及第五小節(jié)的 Machine Learning Basics. 主要會介紹簡單的數(shù)值運算厌衔,梯度更新璧帝,還有機器學(xué)習(xí)基本概念,但沒怎么提太詳細(xì)富寿。
之后就是鼎鼎有名吳教授在 Cousera 上的 Machine Learning睬隶。這門課沒太多說的,太有名了页徐。一如吳教授的風(fēng)格苏潜,簡單易懂,練習(xí)也不難变勇,相信網(wǎng)上也都能找到答案恤左。有點麻煩的是,作業(yè)是用 Octave 來完成搀绣,當(dāng)然因為 Octave 和 MATLAB的關(guān)系飞袋,用MATLAB 也是可以的。里面有些東西挺老的链患,但核心概念都很有用巧鸭,特別是模型訓(xùn)練策略,錯誤分析麻捻。
基礎(chǔ)
接著纲仍,可以讀讀我挺喜歡的 NLP 大佬 Kyunghyun Cho 的 ML w/o DL Lecture Notes (沒有深度學(xué)習(xí)的機器學(xué)習(xí)課堂筆記)。介紹了機器學(xué)習(xí)中經(jīng)典的一些問題贸毕,比如分類郑叠,回歸,還有聚類明棍,還提到各自的一些算法以及與深度學(xué)習(xí)的一些聯(lián)系乡革。值得一提的是,該資料帶有 Jupyter Notebook 的習(xí)題作業(yè)击蹲,所以很推薦把這些作業(yè)也做了署拟,可以打下很好的基礎(chǔ)婉宰。但這個資料介紹不太全面歌豺,而且沒有課程視頻。
還有一個額外的資源是心包,加州理工 Yaser Abu-Mostafa 的 Learning From Data类咧,這個沒上過,也不好評價。但是根據(jù)其他評價是門很棒的課痕惋。
中文資料区宇,可以讀李航的《統(tǒng)計學(xué)習(xí)方法》還有周志華的《機器學(xué)習(xí)》,兩本都不是太難讀值戳。
進階
了解了基礎(chǔ)议谷,如果還想挑戰(zhàn)自己,可以試試卡內(nèi)基梅隆大學(xué)堕虹,Tom Mitchell 教授的 Machine Learning 課程卧晓。相比之前的資料,這門課涉及到很多更深入的話題赴捞,概率圖模型逼裆,Boosting,SVM的核方法赦政,強化學(xué)習(xí)...
還可以去啃兩本大部頭胜宇,Bishop 的《Pattern Recognition and Machine Learning》還有 Murphy 的 《Machine Learning A Probabilistic Perspective》。
或者按照周教授說的恢着,把西瓜書讀一遍之后桐愉,每一章從推薦書籍和推薦論文里面找資料細(xì)讀。