做自然語言處理雷滋,最頭大的事就是語料不足。尤其是在這個大數(shù)據(jù)時代文兢,拿著一點點語料都不好意寫論文晤斩。即使硬著頭皮寫了,也不會有理想的結(jié)果姆坚。在這種緊迫的情況下澳泵,只能硬著頭皮去研究爬蟲,大量爬取語料兼呵。無意間知道Scrapy兔辅,在眾人的幫助下,稍微明白了點怎么使用击喂。決定大規(guī)模的爬語料维苔,從根本上解決所處尷尬境地。時間緊迫懂昂,準備兩臺電腦同時跑介时,爬取不同的網(wǎng)頁。這就需要在另一臺電腦上安裝配置Scrapy凌彬。按以前的方法一步一步裝了一遍沸柔,還是沒有成功。決定卸掉所有铲敛,重新裝褐澎。這次,決定順便再這臺電腦上把強大的Anaconda也裝上吧伐蒋。百度一搜windows Anaconda工三,看中了“windows下安裝python和依賴包的利器——Anaconda”這篇文章迁酸。立馬打開,這一下俭正,困擾我一早上的問題迎刃而解胁出,兩步解決所有問題
一、下載安裝Anaconda
Anaconda下載地址:
http://continuum.io/downloads
下載好之后段审,雙擊就Ok了。
二闹蒜、安裝Scrapy
CMD進入命令行寺枉,直接輸入conda install
scrapy,然后就等著點“y”吧绷落。
裝完感覺太爽了姥闪。
感謝chenxi_zhuhttp://www.th7.cn/system/win/201502/93336.shtml
感謝Anaconda,
感謝Scrapy。
擁有龐大的語料砌烁,指日可待筐喳,哈哈哈