Scrapy框架的使用

一 . scrapy的介紹

1. 什么是scrapy?

        (1) Scrapy是用純Python實(shí)現(xiàn)一個(gè)為了爬取網(wǎng)站數(shù)據(jù)闲询、提取結(jié)構(gòu)性數(shù)據(jù)而編寫的應(yīng)用框架,用途非常廣泛棋恼。

        (2) 框架的力量哪审,用戶只需要定制開發(fā)幾個(gè)模塊就可以輕松的實(shí)現(xiàn)一個(gè)爬蟲塘揣,用來(lái)抓取網(wǎng)頁(yè)內(nèi)容以及各種圖片朝捆,非常之方便百炬。

        (3) Scrapy 使用了 Twisted['tw?st?d] 異步網(wǎng)絡(luò)框架來(lái)處理網(wǎng)絡(luò)通訊褐隆,可以加快我們的下載速度剖踊,不用自己去實(shí)現(xiàn)異步框架,并且包含了各種中間件接口德澈,可以靈活的完成各種需求歇攻。

2. scrapy框架的流程結(jié)構(gòu)圖

image
    各個(gè)功能的簡(jiǎn)介:

            (1) Scrapy Engine(引擎): 負(fù)責(zé)Spider掉伏、ItemPipeline、Downloader澳窑、Scheduler中間的通訊,信號(hào)摊聋、數(shù)據(jù)傳遞等鸡捐。                

            (2) Scheduler(調(diào)度器): 它負(fù)責(zé)接受引擎發(fā)送過(guò)來(lái)的Request請(qǐng)求,并按照一定的方式進(jìn)行整理排列麻裁,入隊(duì)箍镜,當(dāng)引擎需要時(shí),交還給引擎煎源。

            (3)Downloader(下載器):負(fù)責(zé)下載Scrapy Engine(引擎)發(fā)送的所有Requests請(qǐng)求色迂,并將其獲取到的Responses交還給Scrapy Engine(引擎),由引擎交給Spider來(lái)處理手销,

            (4)Spider(爬蟲):它負(fù)責(zé)處理所有Responses,從中分析提取數(shù)據(jù)歇僧,獲取Item字段需要的數(shù)據(jù),并將需要跟進(jìn)的URL提交給引擎锋拖,再次進(jìn)入Scheduler(調(diào)度器)诈悍,

            (5) Item Pipeline(管道):它負(fù)責(zé)處理Spider中獲取到的Item,并進(jìn)行進(jìn)行后期處理(詳細(xì)分析兽埃、過(guò)濾侥钳、存儲(chǔ)等)的地方.

            (6)Downloader Middlewares(下載中間件):你可以當(dāng)作是一個(gè)可以自定義擴(kuò)展下載功能的組件。

            (7)Spider Middlewares(Spider中間件):你可以理解為是一個(gè)可以自定擴(kuò)展和操作引擎和Spider中間通信的功能組件(比如進(jìn)入Spider的Responses;和從Spider出去的Requests)

3. 怎樣安裝scrapy?

        sudo pip3 install scrapy
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末柄错,一起剝皮案震驚了整個(gè)濱河市舷夺,隨后出現(xiàn)的幾起案子苦酱,更是在濱河造成了極大的恐慌,老刑警劉巖给猾,帶你破解...
    沈念sama閱讀 210,978評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件躏啰,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡耙册,警方通過(guò)查閱死者的電腦和手機(jī)给僵,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)详拙,“玉大人帝际,你說(shuō)我怎么就攤上這事∪恼蓿” “怎么了蹲诀?”我有些...
    開封第一講書人閱讀 156,623評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)弃揽。 經(jīng)常有香客問(wèn)我脯爪,道長(zhǎng),這世上最難降的妖魔是什么矿微? 我笑而不...
    開封第一講書人閱讀 56,324評(píng)論 1 282
  • 正文 為了忘掉前任痕慢,我火速辦了婚禮,結(jié)果婚禮上涌矢,老公的妹妹穿的比我還像新娘掖举。我一直安慰自己,他們只是感情好娜庇,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,390評(píng)論 5 384
  • 文/花漫 我一把揭開白布塔次。 她就那樣靜靜地躺著,像睡著了一般名秀。 火紅的嫁衣襯著肌膚如雪励负。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,741評(píng)論 1 289
  • 那天匕得,我揣著相機(jī)與錄音,去河邊找鬼耗跛。 笑死攒发,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的羔砾。 我是一名探鬼主播,決...
    沈念sama閱讀 38,892評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼政溃,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼态秧!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起愤诱,我...
    開封第一講書人閱讀 37,655評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤捐友,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后科吭,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡对人,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年规伐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了匣缘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,569評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡培慌,死狀恐怖柑爸,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情表鳍,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評(píng)論 4 328
  • 正文 年R本政府宣布瓮恭,位于F島的核電站厘熟,受9級(jí)特大地震影響维哈,放射性物質(zhì)發(fā)生泄漏登澜。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,834評(píng)論 3 312
  • 文/蒙蒙 一购撼、第九天 我趴在偏房一處隱蔽的房頂上張望谴仙。 院中可真熱鬧,春花似錦狞甚、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至春霍,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間址儒,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工鸳慈, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留走芋,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,260評(píng)論 2 360
  • 正文 我出身青樓翁逞,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親挖函。 傳聞我的和親對(duì)象是個(gè)殘疾皇子彼念,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,446評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • 一 . scrapy的介紹 1. 什么是scrapy? (1) Scrapy是用純Python實(shí)現(xiàn)...
    HZGTK閱讀 276評(píng)論 0 0
  • 該篇筆記是使用Scrapy的過(guò)程中的一個(gè)大雜燴逐沙,沒(méi)有細(xì)致分章節(jié),所有的開發(fā)過(guò)程中遇到的心得棚赔、總結(jié)和問(wèn)題都融合到一起...
    Bigdata234閱讀 341評(píng)論 0 0
  • Scrapy是用純Python實(shí)現(xiàn)一個(gè)為了爬取網(wǎng)站數(shù)據(jù)徘郭、提取結(jié)構(gòu)性數(shù)據(jù)而編寫的應(yīng)用框架,用途非常廣泛残揉。 Scrap...
    糖炒栗子_01c5閱讀 503評(píng)論 0 0
  • 2018-12-29 安裝scrapy1.1 使用pycharm新建虛擬環(huán)境(python_scrapy)1.2 ...
    用1心閱讀 216評(píng)論 0 0
  • Scrapy 官方文檔 1. 創(chuàng)建自定義爬蟲 目錄結(jié)構(gòu) scrapy.cfg: 項(xiàng)目的配置文件(很少用)zhihu...
    袁夢(mèng)祥941115閱讀 291評(píng)論 0 1