scrapyd使用備忘

寫在前面:

強(qiáng)調(diào)一下攀芯,使用scrapyd并不是就裝一個scrapyd就完事了,為了更方便的使用scrapyd,還需要安裝一個scrapyd-client艇潭,scrapyd相當(dāng)于一個服務(wù)器,為了方便使用這個服務(wù)器我們需要在一個客戶機(jī)上對他進(jìn)行操作戏蔑,關(guān)系如此蹋凝。為何要使用scrapyd,個人認(rèn)為主要分為兩點(diǎn):

  • 更優(yōu)爬蟲進(jìn)行調(diào)度(個人使用場景:也是我使用scrapyd的主要原因总棵,使用場景大致是這樣鳍寂,我需要對一個網(wǎng)站的1000個入口往下進(jìn)行爬去,通過參數(shù)控制啟動1000個爬蟲情龄,scrapyd不會讓這1000個同時啟動而是會依次跑下來這樣迄汛,能同時運(yùn)行多少爬蟲是根據(jù)機(jī)器性能自適應(yīng)決定的)
  • 方便往服務(wù)器上部署爬蟲(原設(shè)計原因)

配置

首先安裝scrapyd,mac下安裝的話刃唤,直接pip安裝即可隔心,ubuntu下有專門的scrapyd源,需要單獨(dú)配置:

pip install scrapyd

安裝完成后啟動服務(wù)尚胞,默認(rèn)的端口是6800硬霍,打開localhost:6800即可

scrapyd

然后安裝scrapyd-client

pip install scrapyd-client

環(huán)境配置到此結(jié)束

使用

(丟人的分割,今天打開簡書發(fā)現(xiàn)了一年前寫的東西笼裳,已經(jīng)忘得差不多了憑著記憶寫一下方便以后在要用到的時候查資料吧唯卖。。躬柬。我能說第一行ubuntu有專門的源要單獨(dú)配置我都忘了嗎拜轨。。允青。ubuntu用戶自己查下吧簡單的)

先說一下scrapyd-client的運(yùn)作機(jī)制吧橄碾,scrapyd-client的作用和web開發(fā)中的gulp作用有點(diǎn)類似(gulp我沒用過說錯了別打我),用于打包你的工程提供給scrapyd服務(wù)器颠锉,因為是python所以會生成一個egg文件法牲,首先修改默認(rèn)生成的scrapy.cfg文件,其中deploy被注釋掉了琼掠,將注釋刪掉拒垃,恢復(fù)默認(rèn)的deploy確保使用先,進(jìn)一步修改根據(jù)個人需求再來吧瓷蛙。修改好的scrapy.cfg形式如下悼瓮,默認(rèn)的是沒有target這個參數(shù)的戈毒,需要配置其他的target部署直接在后面添加寫上自己喜歡的target即可

[deploy:<target>]
url = <url>
project = <project>

使用以下命令將對應(yīng)的工程部署到scrapyd服務(wù)器上去,如果工程沒有問題横堡,完成eggify后(蛋化埋市,不知道中文該咋說),會得到一個200的response翅萤,如果錯了去跑跑爬蟲看看吧恐疲,出錯基本都是代碼本身的問題。version可以不加套么,默認(rèn)應(yīng)該是使用時間戳來進(jìn)行版本控制的,只要主機(jī)時間不要亂跳一般不會有大問題碳蛋,如果自己進(jìn)行版本控制注意版本號的管理不要最后自己也亂了

scrapyd-deploy <target> -p <project> --version <version>

部署完成后胚泌,在對應(yīng)的工程目錄下,輸入

scrapyd-deploy -l

就可以查看目錄下打包的項目有什么肃弟,注意這里的l是小寫玷室,含義和ls基本一致,L大寫有更進(jìn)一步細(xì)化的作用笤受,基本操作中用不上穷缤,也就不表了。
完成上述操作后箩兽,可以使用scrapyd來控制爬蟲了津肛,其中-d參數(shù)是可選的,用于給爬蟲傳入額外的參數(shù)汗贫,例如

curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider -d setting=DOWNLOAD_DELAY=2 -d arg1=val1

如果啟動成功會給你返回

{"status": "ok", "jobid": "6487ec79947edab326d6db28a2d86511e8247444"}

這里的jobid可以在其他的操作中使用身坐,比如中止爬蟲等等,一般用不上落包,也不寫了部蛇,要用查一下API很簡單的。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末咐蝇,一起剝皮案震驚了整個濱河市涯鲁,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌有序,老刑警劉巖抹腿,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異笔呀,居然都是意外死亡幢踏,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進(jìn)店門许师,熙熙樓的掌柜王于貴愁眉苦臉地迎上來房蝉,“玉大人僚匆,你說我怎么就攤上這事〈罨茫” “怎么了咧擂?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長檀蹋。 經(jīng)常有香客問我松申,道長,這世上最難降的妖魔是什么俯逾? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任贸桶,我火速辦了婚禮,結(jié)果婚禮上桌肴,老公的妹妹穿的比我還像新娘皇筛。我一直安慰自己,他們只是感情好坠七,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布水醋。 她就那樣靜靜地躺著,像睡著了一般彪置。 火紅的嫁衣襯著肌膚如雪拄踪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天拳魁,我揣著相機(jī)與錄音惶桐,去河邊找鬼。 笑死的猛,一個胖子當(dāng)著我的面吹牛耀盗,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播卦尊,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼叛拷,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了岂却?” 一聲冷哼從身側(cè)響起忿薇,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎躏哩,沒想到半個月后署浩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡扫尺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年筋栋,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片正驻。...
    茶點(diǎn)故事閱讀 40,503評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡弊攘,死狀恐怖抢腐,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情襟交,我是刑警寧澤迈倍,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站捣域,受9級特大地震影響啼染,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜焕梅,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一迹鹅、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧贞言,春花似錦徒欣、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽脂新。三九已至挪捕,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間争便,已是汗流浹背级零。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留滞乙,地道東北人奏纪。 一個月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像斩启,于是被迫代替她去往敵國和親序调。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,512評論 2 359

推薦閱讀更多精彩內(nèi)容