安裝及基礎(chǔ)設(shè)置

全局安裝scrapy

pip install scrapy

scrapy原理圖

運(yùn)行的流程圖患雏，很直觀

圖片中的數(shù)字標(biāo)明了程序運(yùn)行的基本過(guò)程以及幾大主要模塊蜒车，運(yùn)行過(guò)程：
1奋单，spider發(fā)起請(qǐng)求（請(qǐng)求可以經(jīng)過(guò)中間件進(jìn)行處理）
2镜硕，引擎收到請(qǐng)求后先交給調(diào)度器（scheduler）哥桥，由調(diào)度器決定什么時(shí)候發(fā)起請(qǐng)求
3岁钓，調(diào)度器將請(qǐng)求交給引擎執(zhí)行（以上兩步都有程序自動(dòng)管理，其實(shí)不用管）
4偎巢，引擎將請(qǐng)求交給下載器
5蔼夜，下載器按照請(qǐng)求內(nèi)容去對(duì)應(yīng)的網(wǎng)址發(fā)起請(qǐng)求并返回響應(yīng)（下載器發(fā)起請(qǐng)求和返回響應(yīng)都可以經(jīng)過(guò)中間件處理）
6，引擎收到響應(yīng)后交給spider處理
7压昼，spider根據(jù)響應(yīng)內(nèi)容可以做出再發(fā)出新請(qǐng)求求冷，或是直接從響應(yīng)中截取需要的內(nèi)容，并包裝成一個(gè)item返回給engine
8窍霞，item pipelines收到item匠题，做數(shù)據(jù)整理，數(shù)據(jù)整形但金，保存到數(shù)據(jù)庫(kù)等操作韭山，還可以再發(fā)送請(qǐng)求，做新一輪的爬取

新建一個(gè)爬蟲(chóng)項(xiàng)目（以糗事百科為例傲绣，這個(gè)比較簡(jiǎn)單掠哥，反扒沒(méi)那么厲害）

[scrapy startproject 項(xiàng)目名稱(chēng)]巩踏，新建爬蟲(chóng)項(xiàng)目

初始項(xiàng)目包含的文件（run.py,qsbk_spider.py這兩個(gè)是后面添加的秃诵，等下說(shuō))

setting.py

scrapy的全局配置文件，可以設(shè)置請(qǐng)求時(shí)間間隔塞琼，請(qǐng)求headers等等菠净，這里我們修改兩個(gè)地方

ROBOTSTXT_OBEY = False #不遵守robots協(xié)議
# Override the default request headers:
DEFAULT_REQUEST_HEADERS = {
    'Accept-Encoding': 'gzip, deflate, br',
    'Accept-Language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
    'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1'
}

修改默認(rèn)的請(qǐng)求頭部，不然容易會(huì)被反爬彪杉，這里可設(shè)置的東西有很多毅往，可以根據(jù)文檔自己查看

新建爬蟲(chóng)

在spiders文件夾內(nèi)新建qsbk_spider.py文件

import scrapy

class QSBKSpider(scrapy.Spider):
    name = 'qsbk_spider'    #定義爬蟲(chóng)名字，很重要        
    allowed_domains = ['qiushibaike.com']     #爬蟲(chóng)的抓取的域名派近，未定義的不抓
    start_urls = ['https://www.qiushibaike.com/8hr/page/1/']  #爬蟲(chóng)的起始頁(yè)攀唯，從哪個(gè)網(wǎng)址開(kāi)始抓取
    #默認(rèn)獲取內(nèi)容響應(yīng)后的處理方法，對(duì)應(yīng)原理圖6渴丸、7步之間
    def parse(self, response): 
        pass

新建入口文件run.py

先把爬蟲(chóng)放到一遍侯嘀，接著新建一個(gè)入口文件另凌，方便我們?cè)诰庉嬈髦校ㄎ乙话阌玫膙scode，pycharm類(lèi)似）進(jìn)行調(diào)試

from scrapy import cmdline
cmdline.execute(['scrapy','crawl','qsbk_spider']) #第三個(gè)參數(shù)就是剛剛新建的爬蟲(chóng)的name

這樣就可以在spider里打斷點(diǎn)方便調(diào)試了
初步準(zhǔn)備工作完成戒幔，下一步我們開(kāi)始寫(xiě)爬蟲(chóng)的具體內(nèi)容

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末吠谢，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子诗茎，更是在濱河造成了極大的恐慌工坊，老刑警劉巖，帶你破解...
沈念sama閱讀 217,734評(píng)論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件敢订，死亡現(xiàn)場(chǎng)離奇詭異王污，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)枢析，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,931評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)玉掸，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人醒叁，你說(shuō)我怎么就攤上這事司浪。” “怎么了把沼？”我有些...
開(kāi)封第一講書(shū)人閱讀 164,133評(píng)論 0贊 354
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵啊易，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我饮睬，道長(zhǎng)租谈，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,532評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任捆愁，我火速辦了婚禮割去，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘昼丑。我一直安慰自己呻逆，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,585評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布菩帝。她就那樣靜靜地躺著咖城，像睡著了一般。火紅的嫁衣襯著肌膚如雪呼奢。梳的紋絲不亂的頭發(fā)上宜雀，一...
開(kāi)封第一講書(shū)人閱讀 51,462評(píng)論 1贊 302
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音握础，去河邊找鬼辐董。笑死，一個(gè)胖子當(dāng)著我的面吹牛禀综，可吹牛的內(nèi)容都是我干的简烘。我是一名探鬼主播他匪，決...
沈念sama閱讀 40,262評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼夸研！你這毒婦竟也來(lái)了邦蜜？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 39,153評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤亥至，失蹤者是張志新（化名）和其女友劉穎悼沈，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體姐扮，經(jīng)...
沈念sama閱讀 45,587評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡絮供，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,792評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了茶敏。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片壤靶。...
茶點(diǎn)故事閱讀 39,919評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖惊搏，靈堂內(nèi)的尸體忽然破棺而出贮乳，到底是詐尸還是另有隱情，我是刑警寧澤恬惯，帶...
沈念sama閱讀 35,635評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布向拆，位于F島的核電站，受9級(jí)特大地震影響酪耳，放射性物質(zhì)發(fā)生泄漏浓恳。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,237評(píng)論 3贊 329
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一碗暗、第九天我趴在偏房一處隱蔽的房頂上張望颈将。院中可真熱鬧，春花似錦言疗、人聲如沸晴圾。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,855評(píng)論 0贊 22
一樁弒父案洲守，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)疑务。三九已至沾凄，卻和暖如春梗醇，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背撒蟀。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,983評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工叙谨，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人保屯。一個(gè)月前我還...
沈念sama閱讀 48,048評(píng)論 3贊 370
代替公主和親
正文我出身青樓手负，卻偏偏與公主長(zhǎng)得像涤垫，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子竟终，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,864評(píng)論 2贊 354