Python 2.7
IDE Pycharm 5.0.3
NLTK 3.2.1
前言
需要用到自然語(yǔ)言處理了,安裝調(diào)試過(guò)程記錄一下边翁,省的下次再找
【注意:軟件安裝需求:Python符匾、NLTK瘩例、NLTK-Data必須安裝焰坪,NumPy和Matplotlin推薦安裝聘惦,NetworkX和Prover9可選安裝】
安裝詳細(xì)過(guò)程可見Python與自然語(yǔ)言處理(一)搭建環(huán)境總結(jié)的很好某饰,我這里簡(jiǎn)要說(shuō)明和補(bǔ)充:
安裝Python
滾粗,自己百度
安裝NLTK
Pycharm自帶NLTK包善绎,如果沒有黔漂,請(qǐng)?jiān)赾md窗口輸入命令:
pip install nltk
,下的應(yīng)該蠻快的涂邀。不知道pip是什么瘟仿?滾粗!
安裝NLTK-Data
你可以作死的嘗試:
>>>import nltk
>>>nltk.download()
先點(diǎn)擊Refresh比勉,刷新下,之后選中all-corpora點(diǎn)擊左下角下載就好驹止,至于路徑
要么在C盤中浩聋,要么在Python的根目錄下!C盤根目錄最靠譜!
這是官方正統(tǒng)下載方式臊恋,但是肯定會(huì)出錯(cuò)的衣洁!不僅下的慢,而且下一半就出錯(cuò)抖仅!老紙?jiān)嚵巳危?/em>
這里才是正確的下載方式:最好的方法是用使用@V_can打包好的的包網(wǎng)盤下載下載地址1:云盤密碼znx7坊夫,下來(lái)的包nltk_data.zip 解壓到C盤根目錄下砖第,這樣是最保險(xiǎn)的,防止找不到包环凿。下載地址2:云盤密碼4cp3
NLTK測(cè)試
測(cè)試環(huán)境是否安裝好請(qǐng)按照下列步驟(全部在python console中完成,就是輸入一行輸出一行的那種IDE):
In[4]:from nltk.book import *
# 只輸入import nltk 會(huì)出錯(cuò)的梧兼,但卻有很多博客上都這么寫,我也母雞
之后會(huì)出現(xiàn)如下顯示:
*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908
繼續(xù)測(cè)試輸入:
In[5]:text1
會(huì)輸出:
Out[5]:
<Text: Moby Dick by Herman Melville 1851>
再測(cè)試輸入:
In[6]: text1.concordance("monstrous")
輸出:
Displaying 11 of 11 matches:
ong the former , one was of a most monstrous size . ...
ok智听,這里就演示那么多羽杰,到此,NLP的環(huán)境就裝好了到推,調(diào)試完畢考赛,可以用于自己的實(shí)驗(yàn)了。
總結(jié)
寫的東西不重復(fù)莉测,實(shí)踐過(guò)正確颜骤,有重點(diǎn),對(duì)別人有幫助捣卤,這個(gè)才是最重要的忍抽。
致謝
@monkey131499--Python與自然語(yǔ)言處理(一)搭建環(huán)境
@V_can--Python與自然語(yǔ)言處理_第一期_NLTK入門之環(huán)境搭建