Spiders(爬蟲(chóng)):它負(fù)責(zé)處理所有Responses,從中分析提取數(shù)據(jù)潭千,獲取Item字段需要的數(shù)據(jù),并將需要跟進(jìn)的URL提交給引擎借尿,再次進(jìn)入Scheduler(調(diào)度器)Engine(引擎):負(fù)責(zé)Spider刨晴、ItemPipeline、Downloader路翻、Scheduler中間的通訊狈癞,信號(hào)、數(shù)據(jù)傳遞等茂契。Scheduler(調(diào)度器):它負(fù)責(zé)接受引擎發(fā)送過(guò)來(lái)的Request請(qǐng)求蝶桶,并按照一定的方式進(jìn)行整理排列,入隊(duì)掉冶,當(dāng)引擎需要時(shí)真竖,交還給引擎。Downloader(下載器):負(fù)責(zé)下載Scrapy Engine(引擎)發(fā)送的所有Requests請(qǐng)求厌小,并將其獲取到的Responses交還給Scrapy Engine(引擎)恢共,由引擎交給Spider來(lái)處理ItemPipeline(管道):它負(fù)責(zé)處理Spider中獲取到的Item,并進(jìn)行進(jìn)行后期處理(詳細(xì)分析璧亚、過(guò)濾撑柔、存儲(chǔ)等)的地方.Downloader Middlewares(下載中間件):你可以當(dāng)作是一個(gè)可以自定義擴(kuò)展下載功能的組件框喳。Spider Middlewares(Spider中間件):你可以理解為是一個(gè)可以自定擴(kuò)展和操作引擎和Spider中間通信的功能組件(比如進(jìn)入Spider的Responses;和從Spider出去的Requests)
scrapy框架講解
Snip20190611_5 (1).png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)规阀,“玉大人恒序,你說(shuō)我怎么就攤上這事∷常” “怎么了歧胁?”我有些...
- 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)厉碟。 經(jīng)常有香客問(wèn)我喊巍,道長(zhǎng),這世上最難降的妖魔是什么箍鼓? 我笑而不...
- 正文 為了忘掉前任崭参,我火速辦了婚禮,結(jié)果婚禮上款咖,老公的妹妹穿的比我還像新娘何暮。我一直安慰自己,他們只是感情好铐殃,可當(dāng)我...
- 文/花漫 我一把揭開(kāi)白布海洼。 她就那樣靜靜地躺著,像睡著了一般富腊。 火紅的嫁衣襯著肌膚如雪坏逢。 梳的紋絲不亂的頭發(fā)上,一...
- 那天蟹肘,我揣著相機(jī)與錄音词疼,去河邊找鬼俯树。 笑死帘腹,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的许饿。 我是一名探鬼主播阳欲,決...
- 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了球化?” 一聲冷哼從身側(cè)響起秽晚,我...
- 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎筒愚,沒(méi)想到半個(gè)月后赴蝇,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
- 正文 獨(dú)居荒郊野嶺守林人離奇死亡巢掺,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
- 正文 我和宋清朗相戀三年句伶,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片陆淀。...
- 正文 年R本政府宣布含懊,位于F島的核電站身冬,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏岔乔。R本人自食惡果不足惜吏恭,卻給世界環(huán)境...
- 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望重罪。 院中可真熱鬧樱哼,春花似錦、人聲如沸剿配。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)呼胚。三九已至茄唐,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蝇更,已是汗流浹背沪编。 一陣腳步聲響...
- 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像厨幻,于是被迫代替她去往敵國(guó)和親相嵌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子腿时,可洞房花燭夜當(dāng)晚...
推薦閱讀更多精彩內(nèi)容
- #scrapy框架是什么: #####scrapy是用純Python實(shí)現(xiàn)的一個(gè)為了爬去網(wǎng)站數(shù)據(jù),提取結(jié)構(gòu)數(shù)據(jù)而編寫...
- 本主題主要是scrapy入門,包含內(nèi)容如下:??1. Scrapy框架環(huán)境搭建饭宾;??2. 理解scrapy框架結(jié)...
- Scrapy Scrapy是用純Python實(shí)現(xiàn)一個(gè)為了爬取網(wǎng)站數(shù)據(jù)批糟、提取結(jié)構(gòu)性數(shù)據(jù)而編寫的應(yīng)用框架,用途非常廣泛...
- 身為80后的我纬傲,真的是看三少的小說(shuō)成長(zhǎng)的。記得那時(shí)青春懵懂的我對(duì)于小說(shuō)有一種無(wú)法言喻的喜愛(ài)肤频,尤其是喜歡言情小說(shuō)叹括,也...
- 欣賞醫(yī)院各科對(duì)聯(lián)汁雷,開(kāi)懷笑一笑吧! 耳鼻喉科: 上聯(lián):耳提面命仰人鼻息 下聯(lián):為民喉舌伸張管道 橫批:探求民隱 神經(jīng)...