自然語言處理之路:方法——機器學(xué)習(xí)基礎(chǔ)

一個自然語言處理煉丹師的自白

往期:

自然語言處理之路:前提——英文

自然語言處理之路:前提——數(shù)學(xué)

自然語言處理之路:前提——語言學(xué)

自然語言處理之路:工具——七種兵器

因為各種媒體宣傳谷徙,最近問問學(xué)校新入學(xué)計算機科學(xué)的學(xué)生們,想搞什么研究,結(jié)果十個里有九個要研究機器學(xué)習(xí),中間還一些弄不清深度學(xué)習(xí)和機器學(xué)習(xí)的關(guān)系,實際上是想搞深度學(xué)習(xí)。

原本深度學(xué)習(xí)(深度神經(jīng)網(wǎng)絡(luò))只是機器學(xué)習(xí)領(lǐng)域一個分支,但因為其最近大火,導(dǎo)致對整個領(lǐng)域出現(xiàn)了這樣的劃分:深度的和非深度汗销,或者說深度的和傳統(tǒng)的。雖然現(xiàn)在自然語言處理研究主要用深度學(xué)習(xí)抵窒,但因為很多概念來自機器學(xué)習(xí)弛针,還是有必要了解傳統(tǒng)機器學(xué)習(xí)的。而且如最近周志華提出的深度森林李皇,將其他傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)的理念結(jié)合起來削茁,就可以提出一些很有意思的模型。

下面大概根據(jù)難度將學(xué)習(xí)資料列出來。

入門

最開始想簡單了解一下付材,那么第一步朦拖,可以只將 Goodfellow 的 Deep Learning 前面介紹小節(jié)讀一下,第四小節(jié)的 Numerical Computations 以及第五小節(jié)的 Machine Learning Basics. 主要會介紹簡單的數(shù)值運算厌衔,梯度更新璧帝,還有機器學(xué)習(xí)基本概念,但沒怎么提太詳細(xì)富寿。

之后就是鼎鼎有名吳教授在 Cousera 上的 Machine Learning睬隶。這門課沒太多說的,太有名了页徐。一如吳教授的風(fēng)格苏潜,簡單易懂,練習(xí)也不難变勇,相信網(wǎng)上也都能找到答案恤左。有點麻煩的是,作業(yè)是用 Octave 來完成搀绣,當(dāng)然因為 Octave 和 MATLAB的關(guān)系飞袋,用MATLAB 也是可以的。里面有些東西挺老的链患,但核心概念都很有用巧鸭,特別是模型訓(xùn)練策略,錯誤分析麻捻。

基礎(chǔ)

接著纲仍,可以讀讀我挺喜歡的 NLP 大佬 Kyunghyun Cho 的 ML w/o DL Lecture Notes (沒有深度學(xué)習(xí)的機器學(xué)習(xí)課堂筆記)。介紹了機器學(xué)習(xí)中經(jīng)典的一些問題贸毕,比如分類郑叠,回歸,還有聚類明棍,還提到各自的一些算法以及與深度學(xué)習(xí)的一些聯(lián)系乡革。值得一提的是,該資料帶有 Jupyter Notebook 的習(xí)題作業(yè)击蹲,所以很推薦把這些作業(yè)也做了署拟,可以打下很好的基礎(chǔ)婉宰。但這個資料介紹不太全面歌豺,而且沒有課程視頻。

還有一個額外的資源是心包,加州理工 Yaser Abu-Mostafa 的 Learning From Data类咧,這個沒上過,也不好評價。但是根據(jù)其他評價是門很棒的課痕惋。

中文資料区宇,可以讀李航的《統(tǒng)計學(xué)習(xí)方法》還有周志華的《機器學(xué)習(xí)》,兩本都不是太難讀值戳。

進階

了解了基礎(chǔ)议谷,如果還想挑戰(zhàn)自己,可以試試卡內(nèi)基梅隆大學(xué)堕虹,Tom Mitchell 教授的 Machine Learning 課程卧晓。相比之前的資料,這門課涉及到很多更深入的話題赴捞,概率圖模型逼裆,Boosting,SVM的核方法赦政,強化學(xué)習(xí)...

還可以去啃兩本大部頭胜宇,Bishop 的《Pattern Recognition and Machine Learning》還有 Murphy 的 《Machine Learning A Probabilistic Perspective》。

或者按照周教授說的恢着,把西瓜書讀一遍之后桐愉,每一章從推薦書籍和推薦論文里面找資料細(xì)讀。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末然评,一起剝皮案震驚了整個濱河市仅财,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌碗淌,老刑警劉巖盏求,帶你破解...
    沈念sama閱讀 210,835評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異亿眠,居然都是意外死亡碎罚,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,900評論 2 383
  • 文/潘曉璐 我一進店門纳像,熙熙樓的掌柜王于貴愁眉苦臉地迎上來荆烈,“玉大人,你說我怎么就攤上這事竟趾°竟海” “怎么了?”我有些...
    開封第一講書人閱讀 156,481評論 0 345
  • 文/不壞的土叔 我叫張陵岔帽,是天一觀的道長玫鸟。 經(jīng)常有香客問我,道長犀勒,這世上最難降的妖魔是什么屎飘? 我笑而不...
    開封第一講書人閱讀 56,303評論 1 282
  • 正文 為了忘掉前任妥曲,我火速辦了婚禮,結(jié)果婚禮上钦购,老公的妹妹穿的比我還像新娘檐盟。我一直安慰自己,他們只是感情好押桃,可當(dāng)我...
    茶點故事閱讀 65,375評論 5 384
  • 文/花漫 我一把揭開白布葵萎。 她就那樣靜靜地躺著,像睡著了一般唱凯。 火紅的嫁衣襯著肌膚如雪陌宿。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,729評論 1 289
  • 那天波丰,我揣著相機與錄音壳坪,去河邊找鬼。 笑死掰烟,一個胖子當(dāng)著我的面吹牛爽蝴,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播纫骑,決...
    沈念sama閱讀 38,877評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼蝎亚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了先馆?” 一聲冷哼從身側(cè)響起发框,我...
    開封第一講書人閱讀 37,633評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎煤墙,沒想到半個月后梅惯,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,088評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡仿野,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,443評論 2 326
  • 正文 我和宋清朗相戀三年铣减,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片脚作。...
    茶點故事閱讀 38,563評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡葫哗,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出球涛,到底是詐尸還是另有隱情劣针,我是刑警寧澤,帶...
    沈念sama閱讀 34,251評論 4 328
  • 正文 年R本政府宣布亿扁,位于F島的核電站捺典,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏魏烫。R本人自食惡果不足惜辣苏,卻給世界環(huán)境...
    茶點故事閱讀 39,827評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望哄褒。 院中可真熱鬧稀蟋,春花似錦、人聲如沸呐赡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,712評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽链嘀。三九已至萌狂,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間怀泊,已是汗流浹背茫藏。 一陣腳步聲響...
    開封第一講書人閱讀 31,943評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留霹琼,地道東北人务傲。 一個月前我還...
    沈念sama閱讀 46,240評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像枣申,于是被迫代替她去往敵國和親售葡。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,435評論 2 348

推薦閱讀更多精彩內(nèi)容