利用scrapinghub發(fā)布你的爬蟲項目

用scrapy框架寫了一個爬蟲項目稠炬，想發(fā)布到線上讓他自動執(zhí)行点额，搜索了一下，發(fā)現(xiàn)有個叫scrapinghub的平臺洁灵，可以免費發(fā)布scrapy項目饱岸，所以就來試一下。

注冊scrapinghub賬號并登陸

直接打開scrapinghub注冊徽千，這里沒什么說的苫费。

注冊

可以直接用Google賬號或者GitHub賬號登陸，我就選擇GitHub登陸啦~
登錄之后是這樣的双抽，是空的百框，沒有項目：

登陸之后

我們點擊右上角的Create Project來創(chuàng)建一個Project，這里和GitHub類似荠诬。

創(chuàng)建空的項目

創(chuàng)建一個project

這里Organization已經(jīng)填好了琅翻，用GitHub賬號登陸的話，這里就是你的GitHub昵稱柑贞，其他賬號登錄的應(yīng)該類似方椎。
Name這里就隨便填寫一個名稱就好了，主要是為了方便以后的project管理钧嘶。
項目類型就選Scrapy棠众，那個Portia我還沒去了解它到底是干啥的。弄好了之后就點Create有决。

一個空的爬蟲項目

創(chuàng)建好了之后闸拿，我們會得到一個空的project，里面是沒有代碼的书幕，接下來需要將寫好的scrapy爬蟲放進去新荤，這里和GitHub里面往倉庫里面提交代碼類似。

準備發(fā)布

點擊那個Code & Deploys台汇，到發(fā)布頁面苛骨。這里有兩種發(fā)布方式可供選擇：

第一種方式

發(fā)布scrapy爬蟲

在你的pycharm中安裝shub庫篱瞎，這是一個用于發(fā)布scrapy項目到scrapinghub的庫⊙髦ィ或者你可以直接在命令行中使用pip install shub命令來安裝俐筋，這里我選擇方便的pycharm。
可能有的小伙伴不知道pycharm有如此方便的三方庫管理功能严衬。

安裝shub

打開項目下的pycharm命令行澄者，如果你的項目不是在pycharm中構(gòu)建的也沒關(guān)系，可以在系統(tǒng)命令行中切換到項目目錄中執(zhí)行相關(guān)命令请琳。
使用shub login命令進行登陸粱挡，這里會讓你輸入API key，你可以在這里找到你的API key：

選擇賬戶設(shè)置

選擇 API key

然后復(fù)制俄精，粘貼到命令行就ok了抱怔。

在發(fā)布之前還有一個需要注意的地方：
如果你的項目中使用了scrapy之外的第三方庫，則需要在項目中進行聲明嘀倒，這樣scrapinghub才會為你的項目添加相應(yīng)的第三方庫。聲明的過程很簡單局冰，在你的項目根目錄下添加requirements.txt文件测蘑，并列出你所需要額外添加的第三方庫，類似下面這樣康二，寫清楚你需要的三方庫名稱和版本碳胳。

添加額外支持

再新建一個scrapinghub.yml文件，里面是這樣的：

scrapinghub.yml

這個大家應(yīng)該知道是做什么的沫勿。其實這個文件在發(fā)布項目的時候可以自動生成挨约，但是如果你的爬蟲需要依賴一些scrapinghub所沒有的三方庫的時候，還是最好自己手動新建一個产雹，如果你懶得自己建的話诫惭，可以先發(fā)布項目，生成了scrapinghub.yml文件之后蔓挖，再去編輯它夕土，當(dāng)然scrapinghub會默認提供一部分常用的第三方庫，不需要手動聲明瘟判。

確認無誤之后怨绣，就可以用shub deploy [project id]命令進行發(fā)布了。
project id可以在你的網(wǎng)頁地址欄中找到：
細心的同學(xué)可以看到發(fā)布項目的步驟和命令已經(jīng)在頁面的右下方寫出來了拷获，如果看不懂的話還有貼心的視頻教程篮撑。

project id

發(fā)布成功之后：

發(fā)布成功

回到瀏覽器中刷新一下頁面就看到項目中已經(jīng)有代碼了（請自動忽略shub的更新提示，如果你的shub版本是最新的匆瓜，就不會出現(xiàn)這個提示）赢笨。

本地發(fā)布成功的頁面顯示

2.從GitHub發(fā)布
接下來我們來說一說怎么從GitHub發(fā)布未蝌。
把選項卡切換到GitHub，你會發(fā)現(xiàn)是這樣的：

GitHub未建立連接

點connect一步步操作质欲，建立與GitHub的連接树埠。

與GitHub代碼倉庫建立連接

這里要選擇你的scrapy項目所在的倉庫，然后點擊Connect repo建立連接嘶伟。

連接成功

然后點擊綠色的發(fā)布分支按鈕就可以了怎憋，發(fā)布成功之后會顯示和之前從本地發(fā)布一樣的頁面，這里不再贅述九昧。

項目管理

發(fā)布成功之后回到主面板绊袋，點擊項目名稱進入到項目管理頁面。

管理

看到右上角那個綠色的run按鈕了沒铸鹰，點它癌别，你的spider就在scrapinghub上運行起來了，完全不需要自己去架設(shè)服務(wù)器蹋笼。
并且在下面可以看到爬蟲的運行日志展姐。如果你有多個爬蟲，可以在scrapy的配置文件中聲明爬蟲的優(yōu)先級剖毯，scrapinghub會按照優(yōu)先級順序依次執(zhí)行圾笨。并且會根據(jù)當(dāng)前的狀態(tài)，分類列出你的爬蟲任務(wù)逊谋。

定時執(zhí)行

scrapinghub還有一個強大的功能就是定時執(zhí)行爬蟲任務(wù)擂达，一般我們的需求就是每天定時爬取某個站點來獲取更新的數(shù)據(jù)，剛好定時任務(wù)就派上用場了胶滋。
在scrapinghub中創(chuàng)建定時任務(wù)也非常的簡單板鬓。

在菜單欄左側(cè)點擊Periodic Jobs，就進入到定時任務(wù)面板了究恤。

創(chuàng)建定時任務(wù)

點擊綠色的Add Periodic job按鈕：

創(chuàng)建定時任務(wù)

選擇你需要定時執(zhí)行的spider名稱俭令，在Priority中選擇執(zhí)行任務(wù)的優(yōu)先級，在右邊的時間設(shè)置面板中設(shè)置你要執(zhí)行的時間部宿，點save保存唤蔗，這樣一個定時的spider就創(chuàng)建好了，你就什么都不用關(guān)了窟赏，就每天從數(shù)據(jù)中取數(shù)據(jù)就完了妓柜。
當(dāng)然還有一些高級用法，比如添加參數(shù)什么的涯穷，就靠大家自己摸索了棍掐。

最后

如果你的爬蟲需要更新，就改完代碼重新發(fā)布一遍就可以了拷况。還有其他很多好用的功能作煌，大家可以多多探索掘殴。

抓到的一些數(shù)據(jù)

最后編輯于：2017.12.07 06:54:14

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市粟誓，隨后出現(xiàn)的幾起案子奏寨，更是在濱河造成了極大的恐慌，老刑警劉巖鹰服，帶你破解...
沈念sama閱讀 212,383評論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件病瞳，死亡現(xiàn)場離奇詭異，居然都是意外死亡悲酷，警方通過查閱死者的電腦和手機套菜，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,522評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來设易，“玉大人逗柴，你說我怎么就攤上這事《俜危” “怎么了戏溺？”我有些...
開封第一講書人閱讀 157,852評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長屠尊。經(jīng)常有香客問我于购，道長，這世上最難降的妖魔是什么知染？我笑而不...
開封第一講書人閱讀 56,621評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮斑胜，結(jié)果婚禮上控淡，老公的妹妹穿的比我還像新娘。我一直安慰自己止潘，他們只是感情好掺炭，可當(dāng)我...
茶點故事閱讀 65,741評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著凭戴，像睡著了一般涧狮。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上么夫，一...
開封第一講書人閱讀 49,929評論 1贊 290
城市分裂傳說
那天者冤，我揣著相機與錄音，去河邊找鬼档痪。笑死涉枫，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的腐螟。我是一名探鬼主播愿汰，決...
沈念sama閱讀 39,076評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼困后，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了衬廷？” 一聲冷哼從身側(cè)響起摇予，我...
開封第一講書人閱讀 37,803評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎吗跋，沒想到半個月后侧戴，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,265評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡小腊，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,582評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年救鲤，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片秩冈。...
茶點故事閱讀 38,716評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡本缠，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出入问，到底是詐尸還是另有隱情丹锹，我是刑警寧澤，帶...
沈念sama閱讀 34,395評論 4贊 333
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布芬失，位于F島的核電站楣黍，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏棱烂。R本人自食惡果不足惜租漂，卻給世界環(huán)境...
茶點故事閱讀 40,039評論 3贊 316
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望颊糜。院中可真熱鬧哩治，春花似錦、人聲如沸衬鱼。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,798評論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽鸟赫。三九已至蒜胖，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間抛蚤，已是汗流浹背台谢。一陣腳步聲響...
開封第一講書人閱讀 32,027評論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留岁经，地道東北人对碌。一個月前我還...
沈念sama閱讀 46,488評論 2贊 361
代替公主和親
正文我出身青樓，卻偏偏與公主長得像蒿偎，于是被迫代替她去往敵國和親朽们。傳聞我的和親對象是個殘疾皇子怀读，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 43,612評論 2贊 350