如果你剛接觸自然語言處理并對她感興趣浦夷,最好讀幾本這方面的書籍辖试,除了能讓你知道自然語言處理各個領(lǐng)域是干什么的外,還能培養(yǎng)一下NLP的感覺劈狐。以下四本書是我讀研期間閱讀和接觸過的罐孝,如果您還有好書推薦,歡迎補充肥缔。
1莲兢、**《自然語言處理綜論》 **(Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition)
這本書的權(quán)威自不用說,譯者是馮志偉老師和孫樂老師续膳,當年讀這本書的時候改艇,還不知道馮老師是誰,但是讀起來感覺非常好,想想如果沒有在這個領(lǐng)域積攢多年的實力,是不可能翻譯的這么順暢的诉植。這本書在國內(nèi)外的評價都比較好嵌莉,對自然語言處理的兩個學派(語言學派和統(tǒng)計學派)所關(guān)注的內(nèi)容都有所包含,但因此也失去一些側(cè)重點。從我的角度來說更偏向于統(tǒng)計部分,所以需要了解統(tǒng)計自然語言處理的讀者下面兩本書更適合做基礎(chǔ)閱讀。不過這本書的N-gram語言模型部分寫得非常不錯纪隙,是SRILM的推薦閱讀參考。
2扛或、《統(tǒng)計自然語言處理基礎(chǔ)》(Foundations of Statistical Natural Language Processing)
我比較喜歡這本書绵咱,這兩年的學習過程中也經(jīng)常拿這本書作為參考,可能與我做統(tǒng)計機器翻譯有關(guān)吧”妫看china pub上的評論說這本書的翻譯比較差艾恼,自己的感覺是還行。當然麸锉,這是國內(nèi)翻譯圖書的一個通材粕堋:除了很難有翻譯的非常好的書外,另外一個原因就是滯后性花沉。如果e文足夠好的壞柳爽,就及時看英文版吧。這本書在統(tǒng)計基本部分的介紹很不錯碱屁,另外n元語法部分講得也比較好磷脯,也是SRILM的推薦閱讀。
3娩脾、《統(tǒng)計自然語言處理》
這是北京自動化所宗成慶老師今年5月出版的一本專著赵誓,我有幸較早的閱讀了這本書的很多章節(jié)。一個很強的感覺是:如果你想了解相關(guān)領(lǐng)域的國內(nèi)外最新進展柿赊,這本書非常值得一讀俩功。上面兩本書在由于出版稍早的緣故,很多領(lǐng)域最新的方法都沒有介紹碰声。而這本書剛剛出版诡蜓,宗老師對國內(nèi)外現(xiàn)狀把握的也比較好,因此書中充分體現(xiàn)了這方面的信息胰挑。另外統(tǒng)計機器翻譯這一部分寫得很詳細很不錯蔓罚,這可能與宗老師亦是這個領(lǐng)域的研究者有關(guān)吧。
4洽腺、《計算機自然語言處理》
這是我最早看的一部自然語言處理方面的書籍,和上面幾部大部頭的書籍相比覆旱,這本書很薄蘸朋,可以很快的看完。書的內(nèi)容我都有點忘了扣唱,但是印象中可以在每個章節(jié)看到國內(nèi)這個領(lǐng)域的研究歷史和相關(guān)單位藕坯。這時才發(fā)現(xiàn)母校HIT在這個領(lǐng)域的超強實力,只是可惜這時候已經(jīng)離開冰城了噪沙。
這些書籍怎么讀都行炼彪,泛覽也罷,精讀也行正歼,只要有時間辐马,多讀書是沒壞處的。我自己的經(jīng)驗是局义,先泛泛的瀏覽或閱讀一篇喜爷,對于比較晦澀的部分可以先跳過去冗疮,然后對自己感興趣的領(lǐng)域或者將要從事的領(lǐng)域的相關(guān)章節(jié)進行精讀,當然檩帐,書籍一般在開始的幾個章節(jié)講些基礎(chǔ)性的知識术幔,這部分最好也仔細揣摩一下。真正要對自己研究的領(lǐng)域深刻了解湃密,還得好好讀一下本領(lǐng)域的相關(guān)論文诅挑。
轉(zhuǎn)載:“我愛自然語言處理”: