Mac下pyspider的安裝

最近在學(xué)爬蟲芥炭,在配置環(huán)境中遇到幾個麻煩晴股,有個困擾不短時間的就是pyspider 的安裝调榄。
這里把安裝完成的步驟捋一捋踊赠。我是在anaconda下的虛擬環(huán)境中安裝的,所以每庆,別的情況我不是很清楚筐带。

  1. 安裝pycurl
    $ pip install curl

  2. 安裝pyspider
    $ pip install pyspider

  3. 嘗試運行
    $ pyspider
    這里我就出問題了,顯示importError缤灵,源碼里面使用了async作為變量名伦籍,但是python3.7以后async已經(jīng)是關(guān)鍵字了蓝晒,所以會報錯。(因為我的虛擬環(huán)境是3.7帖鸦,懶得退了)
    下面改動一下源碼

  4. 修改
    $ cd ~/anaconda3/envs/webspider/lib/python3.7/site-packages/pyspider
    $ ack async (ack是一個命令行的grep增強(qiáng)工具)
    顯示如下:

run.py
231:            async=True, get_object=False, no_input=False):
245:                      poolsize=poolsize, proxy=proxy, async=async)
365:        webui_fetcher = ctx.invoke(fetcher, async=False, get_object=True, no_input=True, **fetcher_config)

fetcher/tornado_fetcher.py
81:    def __init__(self, inqueue, outqueue, poolsize=100, proxy=None, async=True):
89:        self.async = async
95:        if self.async:
117:        if self.async:
118:            return self.async_fetch(task, callback)
120:            return self.async_fetch(task, callback).result()
123:    def async_fetch(self, task, callback=None):
155:            return self.ioloop.run_sync(functools.partial(self.async_fetch, task, lambda t, _, r: True))

webui/app.py
95:    'fetch': lambda x: tornado_fetcher.Fetcher(None, None, async=False).fetch(x),

可以看到芝薇,源碼中有很多使用了很多處async,我們進(jìn)行修改作儿。
使用vim修改是很快的洛二,但是這里要注意,位于fetcher/tornado_fetcher.py中有幾個是導(dǎo)入tornado包中的類名中也包含了async攻锰,所以要注意晾嘶,在修改這個文件時不要全局修改。(async都可以改娶吞,Async不能改垒迂,都是在類名中)

  1. 再次嘗試運行
    $ pyspider
    又報錯了
ValueError: Invalid configuration:
  - Deprecated option 'domaincontroller': use 'http_authenticator.domain_controller' instead.

這是WsgiDAV發(fā)布了版本 pre-release 3.x導(dǎo)致的。
修改 pyspider/webui/webdav.py 第203行:

config = DEFAULT_CONFIG.copy()
 config.update({
    'mount_path': '/dav',
    'provider_mapping': {
        '/': ScriptProvider(app)
    },
    #'domaincontroller': NeedAuthController(app),
    'http_authenticator': {
        'HTTPAuthenticator':NeedAuthController(app),
    },
    
    'verbose': 1 if app.debug else 0,
    
    'dir_browser': {'davmount': False,
                    #'enable': True,
                    'msmount': False,
                    'response_trailer': ''},
})
dav_app = WsgiDAVApp(config)

再次運行pyspider妒蛇,成功机断!

 ?  ~ pyspider all
phantomjs fetcher running on port 25555
[I 190509 15:43:32 result_worker:49] result_worker starting...
[I 190509 15:43:33 processor:211] processor starting...
[I 190509 15:43:33 tornado_fetcher:638] fetcher starting...
[I 190509 15:43:33 scheduler:647] scheduler starting...
[I 190509 15:43:33 scheduler:782] scheduler.xmlrpc listening on 127.0.0.1:23333
[I 190509 15:43:33 scheduler:586] in 5m: new:0,success:0,retry:0,failed:0
[I 190509 15:43:33 app:76] webui running on 0.0.0.0:5000

如果你出現(xiàn)特殊情況:

Error: Could not create web server listening on port 25555
Error: Could not create web server listening on port 25555
Error: Could not create web server listening on port 25555
...

是因為你后臺運行了phantomjs
$ ps

  PID TTY           TIME CMD
  371 ttys000    0:00.05 /Applications/iTerm.app/Contents/MacOS/iTerm2 --server /usr/bin/login -fqpl zhangyin /Applications/iTerm.app/Contents/MacOS/iTerm2
  375 ttys000    0:01.19 -zsh
 1351 ttys000    2:13.00 phantomjs --ssl-protocol=any --disk-cache=true /Users/zhangyin/anaconda3/envs/six/lib/python3.6/site-packages/pyspider/fetcher/pha
 2289 ttys000    0:00.03 tmux new -s webspider
 3708 ttys001    0:00.90 -zsh
 2476 ttys002    0:00.85 -zsh
 5958 ttys003    0:00.49 -zsh

殺掉進(jìn)程就可以了
$ kill -9 1351

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末材部,一起剝皮案震驚了整個濱河市毫缆,隨后出現(xiàn)的幾起案子唯竹,更是在濱河造成了極大的恐慌乐导,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,525評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件浸颓,死亡現(xiàn)場離奇詭異物臂,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)产上,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評論 3 395
  • 文/潘曉璐 我一進(jìn)店門棵磷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人晋涣,你說我怎么就攤上這事仪媒。” “怎么了谢鹊?”我有些...
    開封第一講書人閱讀 164,862評論 0 354
  • 文/不壞的土叔 我叫張陵算吩,是天一觀的道長。 經(jīng)常有香客問我佃扼,道長偎巢,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,728評論 1 294
  • 正文 為了忘掉前任兼耀,我火速辦了婚禮压昼,結(jié)果婚禮上求冷,老公的妹妹穿的比我還像新娘。我一直安慰自己窍霞,他們只是感情好匠题,可當(dāng)我...
    茶點故事閱讀 67,743評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著官撼,像睡著了一般梧躺。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上傲绣,一...
    開封第一講書人閱讀 51,590評論 1 305
  • 那天掠哥,我揣著相機(jī)與錄音,去河邊找鬼秃诵。 笑死续搀,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的菠净。 我是一名探鬼主播禁舷,決...
    沈念sama閱讀 40,330評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼毅往!你這毒婦竟也來了牵咙?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,244評論 0 276
  • 序言:老撾萬榮一對情侶失蹤攀唯,失蹤者是張志新(化名)和其女友劉穎洁桌,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體侯嘀,經(jīng)...
    沈念sama閱讀 45,693評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡另凌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,885評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了戒幔。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吠谢。...
    茶點故事閱讀 40,001評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖诗茎,靈堂內(nèi)的尸體忽然破棺而出工坊,到底是詐尸還是另有隱情,我是刑警寧澤敢订,帶...
    沈念sama閱讀 35,723評論 5 346
  • 正文 年R本政府宣布王污,位于F島的核電站,受9級特大地震影響枢析,放射性物質(zhì)發(fā)生泄漏玉掸。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,343評論 3 330
  • 文/蒙蒙 一醒叁、第九天 我趴在偏房一處隱蔽的房頂上張望司浪。 院中可真熱鬧泊业,春花似錦、人聲如沸啊易。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽租谈。三九已至篮奄,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間割去,已是汗流浹背窟却。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留呻逆,地道東北人夸赫。 一個月前我還...
    沈念sama閱讀 48,191評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像咖城,于是被迫代替她去往敵國和親茬腿。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,955評論 2 355

推薦閱讀更多精彩內(nèi)容