MAC 下搭建 PySpider

最近在學(xué)習(xí)Python爬蟲(chóng)坐求、想再自己本地MAC下搭建PySpider框架蚕泽,經(jīng)歷了步步為坑的遭遇。桥嗤。须妻。

首先安裝一下PySpider

我用的是Python3、pip3泛领,所以我下載操作都是以Python3荒吏、pip3 為主。

先打開(kāi)pyspider文檔:http://docs.pyspider.org/en/latest/

安裝命令:pip3 install pyspider

啟動(dòng):pyspinder all

第一個(gè)坑來(lái)了:


其實(shí)這個(gè)問(wèn)題就是pyspider中把a(bǔ)sync設(shè)置為關(guān)鍵字了渊鞋,而async可是python3.7的關(guān)鍵字啊绰更。所以解決辦法就是 打開(kāi):/usr/local/lib/python3.7/site-packages/pyspider/run.py,將async改為:asyncs(建議使用編輯器批量修改锡宋,具體改為什么儡湾、隨意)

改完之后、很多用戶(hù)可能會(huì)直接啟動(dòng):pyspider all? 結(jié)果發(fā)現(xiàn)還是不行


不過(guò)這次不是關(guān)鍵字沖突了员辩、這個(gè)是說(shuō): phantomjs 沒(méi)找到盒粮、需要安裝phantomjs。了解過(guò)pyspider的都知道奠滑、pyspider+phantomjs 配合是很好用的丹皱。接下來(lái)就安裝phantomjs?

1).下載phantomjs(http://phantomjs.org/download.html)官網(wǎng)下載mac版本

2).下載后直接解壓,將解壓后的phantomjs-2.1.1-macosx文件夾放到你想放的目錄下(隨意宋税、開(kāi)心就好)?

然后執(zhí)行:pwd? ?把路徑復(fù)制一份摊崭、備用

3).添加全局變量,終端輸入vim .bash_profile 添加語(yǔ)句(vim 語(yǔ)法相信大家是有點(diǎn)基礎(chǔ)的杰赛。這里簡(jiǎn)單列幾個(gè)一會(huì)用的上的呢簸。插入:i,退出:電腦的 esc 按鍵乏屯,:wq! 保存并關(guān)閉)

打開(kāi)后:i? ? ? 直接復(fù)制過(guò)去? export PATH=/你放的目錄路徑[上面 pwd 的結(jié)果]/phantomjs-2.1.1-macosx/bin:$PATH

5).終端輸入source .bash_profile? ? ?讓剛才的環(huán)境變量生效

6).終端輸入 phantomjs --version 檢測(cè)是否配置成功??

如果出現(xiàn)版本號(hào)根时、接OK了

接下來(lái)是不是想直接啟動(dòng)一下?pyspider all? 結(jié)果發(fā)現(xiàn)還是不行

這次出現(xiàn)的又是第一次出現(xiàn)的關(guān)鍵字沖突問(wèn)題? ---? 沒(méi)辦法、就是這么坑


一樣的操作辰晕、打開(kāi):/usr/local/lib/python3.7/site-packages/pyspider/fetcher/tornado_fetcher.py蛤迎,將async改為:asyncs(建議使用編輯器批量修改,具體改為什么含友、隨意)

繼續(xù)測(cè)試替裆、啟動(dòng):pyspider all?

(這里簡(jiǎn)單說(shuō)一下校辩、每次啟動(dòng)的時(shí)候都會(huì)出現(xiàn)以下情況)

這個(gè)是端口占用問(wèn)一下、經(jīng)常使用linux 的人這個(gè)應(yīng)該不是什么問(wèn)題

處理方式:? ?查看占用端口的PID? ?lsof -i:25555? ? ? ? ? 殺死這個(gè)PID:kill -9 57349

接下來(lái)繼續(xù)啟動(dòng)辆童、你會(huì)發(fā)現(xiàn)宜咒,還是報(bào)錯(cuò)。把鉴。? 是不是醉了故黑,淡定、淡定纸镊、淡定……

其實(shí)這個(gè)還是老問(wèn)題:關(guān)鍵字占用問(wèn)題倍阐、同樣的去修改即可:

打開(kāi):/usr/local/lib/python3.7/site-packages/pyspider/webui/app.py? ? ?將async改為:asyncs(建議使用編輯器批量修改,具體改為什么逗威、隨意)

修改完、殺死進(jìn)程岔冀、啟動(dòng)

對(duì)凯旭、是的、又爆了…… 而且這個(gè)問(wèn)題比較尷尬使套,這個(gè)是pycurl 安裝錯(cuò)誤問(wèn)題罐呼、網(wǎng)上有好多教程

下面的操作是無(wú)效的

(? ?pip uninstall pycurl

export PYCURL_SSL_LIBRARY=openssl

pip install pycurl --compile? )

結(jié)果你會(huì)發(fā)現(xiàn)、不行侦高,怎么辦嫉柴?我測(cè)試了直接在github 上下載源碼、然后安裝奉呛,還是不行

別急计螺、解決方法來(lái)了:

pip3 uninstall pycurl# 卸載庫(kù)

export PYCURL_SSL_LIBRARY=openssl

export LDFLAGS=-L/usr/local/opt/openssl/lib

export CPPFLAGS=-I/usr/local/opt/openssl/include# openssl相關(guān)頭文件路徑

pip3 install pycurl --compile --no-cache-dir # 重新編譯安裝

執(zhí)行完之后測(cè)試:?

OK!G谱场登馒!但是、但是咆槽、但是……別激動(dòng)陈轿,可能還有問(wèn)題

再次啟動(dòng):

是的、這是我遇到的最后一個(gè)坑了秦忿、

這是WsgiDAV發(fā)布了版本 pre-release 3.x導(dǎo)致的麦射,所以只要把版本降下來(lái)就好了。

執(zhí)行命令:pip3 install wsgidav==2.4.1

終于完成了灯谣、現(xiàn)在可以很?chē)虖埖膯?dòng)了

查看端口占用程序潜秋、殺死、啟動(dòng):

打開(kāi)瀏覽器:http:// localhost:5000 /

完成3晏搿0氲取揍愁!
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市杀饵,隨后出現(xiàn)的幾起案子莽囤,更是在濱河造成了極大的恐慌,老刑警劉巖切距,帶你破解...
    沈念sama閱讀 206,378評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件朽缎,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡谜悟,警方通過(guò)查閱死者的電腦和手機(jī)话肖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)葡幸,“玉大人最筒,你說(shuō)我怎么就攤上這事∥颠叮” “怎么了床蜘?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,702評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)蔑水。 經(jīng)常有香客問(wèn)我邢锯,道長(zhǎng),這世上最難降的妖魔是什么搀别? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,259評(píng)論 1 279
  • 正文 為了忘掉前任丹擎,我火速辦了婚禮,結(jié)果婚禮上歇父,老公的妹妹穿的比我還像新娘蒂培。我一直安慰自己,他們只是感情好庶骄,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布毁渗。 她就那樣靜靜地躺著,像睡著了一般单刁。 火紅的嫁衣襯著肌膚如雪灸异。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,036評(píng)論 1 285
  • 那天羔飞,我揣著相機(jī)與錄音肺樟,去河邊找鬼。 笑死逻淌,一個(gè)胖子當(dāng)著我的面吹牛么伯,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播卡儒,決...
    沈念sama閱讀 38,349評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼田柔,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼俐巴!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起硬爆,我...
    開(kāi)封第一講書(shū)人閱讀 36,979評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤欣舵,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后缀磕,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體缘圈,經(jīng)...
    沈念sama閱讀 43,469評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評(píng)論 2 323
  • 正文 我和宋清朗相戀三年袜蚕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了糟把。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,059評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡牲剃,死狀恐怖遣疯,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情颠黎,我是刑警寧澤另锋,帶...
    沈念sama閱讀 33,703評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站狭归,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏文判。R本人自食惡果不足惜过椎,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望戏仓。 院中可真熱鬧疚宇,春花似錦、人聲如沸赏殃。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,262評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)仁热。三九已至榜揖,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間抗蠢,已是汗流浹背举哟。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留迅矛,地道東北人妨猩。 一個(gè)月前我還...
    沈念sama閱讀 45,501評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像秽褒,于是被迫代替她去往敵國(guó)和親壶硅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子威兜,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容