Centos作為代理服務(wù)器為Scrapy爬蟲提供代理服務(wù)

Centos作為代理服務(wù)器為Scrapy爬蟲提供代理服務(wù)

在我之前的文章Scrapy-redis分布式爬蟲+Docker快速部署中,主要是介紹了分布式和Docker的使用,但爬蟲在正常爬取中還是遭遇了ban IP......所以就得搞代理了.


由于2億的數(shù)據(jù)已經(jīng)跑了7000w了才被ban的IP,所以我覺得是因為對方發(fā)現(xiàn)了這不正常的請求(每秒400次左右,而且是同一個IP發(fā)出),再怎么也會覺得不正常,果然還是沒逃過被ban的命運,當(dāng)時想了以下幾個方案.由于要爬的網(wǎng)站是國外的,是被墻的,所以國內(nèi)那些免費的IP池都沒法用,只能找國外的,但是找了一圈沒找到合適的,所以有以下幾個方案

  1. vultr開5刀的機器,用來做代理服務(wù)器
  2. 用信用卡去擼aws
  3. crawlera

第1、2的方案其實都差不多,畢竟vultraws都是可以刪機器換IP的,但是vultr要花錢,但按使用時間算,其實也用不了多少錢,aws呢可以擼個免費的.

第3種crawlera倒是最省事的,但是價格實在太貴

image

按這個價格,我再爬一億數(shù)據(jù)5000$都搞不下來

由于用信用卡去擼 aws過程也煩,所以直接在vultr上開了臺5$機器用來做代理了.


代理需要使用的工具
1珍逸、Centos服務(wù)器一臺(Ubuntu也可)
2渔彰、TinyProxy

步驟

用ssh鏈接上服務(wù)器安裝TinyProxy
命令:yum install tinyproxy
Ubuntuapt即可
安裝好后修改conf文件
路徑在/etc/tinyproxy.conf

Port 8888 #預(yù)設(shè)是8888 Port,你可以更改 
Allow 127.0.0.1 #將127.0.0.1改成你自己的IP 
#例如你的IP 是1.2.3.4,你改成Allow 1.2.3.4,那只有你才可以連上這個Proxy 
#若你想任何IP都可以臉到Proxy在Allow前面打#注釋

打開端口
iptables -A INPUT -p tcp --dport 8888 -j ACCEPT
注意:這樣做了之后,你可能照樣連不上,因為防火墻沒關(guān),使用命令將防火墻關(guān)閉
systemctl stop firewalld.service


然后去你的服務(wù)器里使用curl命令試試能否連接
curl -x xxx.xxx.xxx.xxx:8888 www.baidu.com
看看能否請求成功,如果可以,代理則啟動成功.
然后就是給爬蟲加個middleware的事了

class ProxyMiddleware(object):

    def process_request(self, request,spider):
        request.meta['proxy'] = 'http://149.28.xxx.xxx:8889'

然后在setting中使用

DOWNLOADER_MIDDLEWARES = {
    'vmoredis.middlewares.ProxyMiddleware':540,
}

重新開啟爬蟲,完事.等到被ban了匿值,在換個IP繼續(xù)爬.
如果哪位有免費的國外IP代理求推薦.想拿來做代理池.萬分感謝
文章中有錯誤希望大家指出,有問題歡迎私信

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末骨宠,一起剝皮案震驚了整個濱河市纵装,隨后出現(xiàn)的幾起案子髓窜,更是在濱河造成了極大的恐慌扇苞,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件纱烘,死亡現(xiàn)場離奇詭異杨拐,居然都是意外死亡,警方通過查閱死者的電腦和手機擂啥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進(jìn)店門哄陶,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人哺壶,你說我怎么就攤上這事屋吨⊙寻” “怎么了?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵至扰,是天一觀的道長鳍徽。 經(jīng)常有香客問我,道長敢课,這世上最難降的妖魔是什么阶祭? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮直秆,結(jié)果婚禮上濒募,老公的妹妹穿的比我還像新娘。我一直安慰自己圾结,他們只是感情好瑰剃,可當(dāng)我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著筝野,像睡著了一般晌姚。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上歇竟,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天挥唠,我揣著相機與錄音,去河邊找鬼途蒋。 笑死猛遍,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的号坡。 我是一名探鬼主播,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼梯醒,長吁一口氣:“原來是場噩夢啊……” “哼宽堆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起茸习,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤畜隶,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后号胚,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體籽慢,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年猫胁,在試婚紗的時候發(fā)現(xiàn)自己被綠了箱亿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡弃秆,死狀恐怖届惋,靈堂內(nèi)的尸體忽然破棺而出髓帽,到底是詐尸還是另有隱情,我是刑警寧澤脑豹,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布郑藏,位于F島的核電站,受9級特大地震影響瘩欺,放射性物質(zhì)發(fā)生泄漏必盖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一俱饿、第九天 我趴在偏房一處隱蔽的房頂上張望筑悴。 院中可真熱鬧,春花似錦稍途、人聲如沸阁吝。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽突勇。三九已至,卻和暖如春坷虑,著一層夾襖步出監(jiān)牢的瞬間甲馋,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工迄损, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留定躏,地道東北人。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓芹敌,卻偏偏與公主長得像痊远,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子氏捞,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容