scrapy框架

scrapy框架的幾大模塊:

Scrapy Engine(引擎): 負(fù)責(zé)Spider、ItemPipeline、Downloader豹障、Scheduler中間的通訊冯事,信號(hào)、數(shù)據(jù)傳遞等血公。
Scheduler(調(diào)度器): 它負(fù)責(zé)接受引擎發(fā)送過來的Request請(qǐng)求昵仅,并按照一定的方式進(jìn)行整理排列,入隊(duì)累魔,當(dāng)引擎需要時(shí)摔笤,交還給引擎。
Downloader(下載器):負(fù)責(zé)下載Scrapy Engine(引擎)發(fā)送的所有Requests請(qǐng)求垦写,并將其獲取到的Responses交還給Scrapy Engine(引擎)吕世,由引擎交給Spider來處理,
Spider(爬蟲):它負(fù)責(zé)處理所有Responses,從中分析提取數(shù)據(jù)梯投,獲取Item字段需要的數(shù)據(jù)命辖,并將需要跟進(jìn)的URL提交給引擎,再次進(jìn)入Scheduler(調(diào)度器)分蓖,
Item Pipeline(管道):它負(fù)責(zé)處理Spider中獲取到的Item尔艇,并進(jìn)行進(jìn)行后期處理(詳細(xì)分析、過濾么鹤、存儲(chǔ)等)的地方.

創(chuàng)建爬蟲項(xiàng)目:

scrapy startproject 爬蟲項(xiàng)目名稱
生成項(xiàng)目文件:
scrapy genspider qidian qidian.com
scrapy genspider -t crawl ziru ziroom.com(通用爬蟲)

運(yùn)行項(xiàng)目:

在項(xiàng)目中spiders文件中 運(yùn)行scrapy crawl 項(xiàng)目名稱(不加后綴)

目前對(duì)于學(xué)習(xí)框架出現(xiàn)的問題:

對(duì)于框架的操作终娃,爬取數(shù)據(jù)基本上沒問題,可能對(duì)于復(fù)雜的接口尋找URL比較費(fèi)勁午磁,還有對(duì)mogdb數(shù)據(jù)庫操作不熟悉尝抖,數(shù)據(jù)存到mogdb數(shù)據(jù)庫不會(huì)使用,對(duì)于管道不是很理解寫法迅皇。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末昧辽,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子登颓,更是在濱河造成了極大的恐慌搅荞,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件框咙,死亡現(xiàn)場(chǎng)離奇詭異咕痛,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)喇嘱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門茉贡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人者铜,你說我怎么就攤上這事腔丧》乓” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵愉粤,是天一觀的道長(zhǎng)砾医。 經(jīng)常有香客問我,道長(zhǎng)衣厘,這世上最難降的妖魔是什么如蚜? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮影暴,結(jié)果婚禮上错邦,老公的妹妹穿的比我還像新娘。我一直安慰自己坤检,他們只是感情好兴猩,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著早歇,像睡著了一般倾芝。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上箭跳,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天晨另,我揣著相機(jī)與錄音,去河邊找鬼谱姓。 笑死借尿,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的屉来。 我是一名探鬼主播路翻,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼茄靠!你這毒婦竟也來了茂契?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤慨绳,失蹤者是張志新(化名)和其女友劉穎掉冶,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體脐雪,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡厌小,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了战秋。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片璧亚。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖脂信,靈堂內(nèi)的尸體忽然破棺而出涨岁,到底是詐尸還是另有隱情拐袜,我是刑警寧澤吉嚣,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布梢薪,位于F島的核電站,受9級(jí)特大地震影響尝哆,放射性物質(zhì)發(fā)生泄漏秉撇。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一秋泄、第九天 我趴在偏房一處隱蔽的房頂上張望琐馆。 院中可真熱鬧,春花似錦恒序、人聲如沸瘦麸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽滋饲。三九已至,卻和暖如春喊巍,著一層夾襖步出監(jiān)牢的瞬間屠缭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工崭参, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留呵曹,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓何暮,卻偏偏與公主長(zhǎng)得像奄喂,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子海洼,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 直接上圖(爬蟲架構(gòu)圖) ① Scrapy Engine(引擎) 引擎負(fù)責(zé)控制數(shù)據(jù)流在系統(tǒng)中所有組件中流動(dòng)跨新,并在相應(yīng)...
    Lrrrrtt閱讀 461評(píng)論 0 0
  • Scrapy 框架基本了解以及Spiders爬蟲,首先我們先了解下Scrapy 框架基本原理贰军,然后我們用一個(gè)簡(jiǎn)單的...
    博行天下閱讀 4,558評(píng)論 7 46
  • 一個(gè)完整的爬蟲程序词疼,應(yīng)該包含五個(gè)部分俯树,分別是負(fù)責(zé)url鏈接管理的URL管理器,負(fù)責(zé)獲取網(wǎng)絡(luò)數(shù)據(jù)的Downloade...
    zhile_doing閱讀 342評(píng)論 0 1
  • (一) 這種感覺就像是 在一堆長(zhǎng)耳朵的兔子里頭贰盗, 戴了好久的假耳朵的我许饿, 被一把抓下來 “快來看,它是短耳朵” 你...
    曹小北閱讀 942評(píng)論 0 0
  • 圖文/金金 每個(gè)人都有自己的屬性舵盈! 一個(gè)人身上的自然屬性多了社會(huì)屬...
    悠然隨筆閱讀 166評(píng)論 3 2