第六章 Scrapy框架(十三) 2020-03-15

十三象缀、Scrapy框架–實(shí)戰(zhàn)–zcool網(wǎng)站精選圖高速下載(2


settings.py?設(shè)置代碼


import os

?

BOT_NAME= 'imagedownload'

?

SPIDER_MODULES= ['imagedownload.spiders']

NEWSPIDER_MODULE= 'imagedownload.spiders'

?

DEFAULT_REQUEST_HEADERS= {

? 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

? 'Accept-Language': 'en',

? 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1;WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132Safari/537.36'

}

?

ITEM_PIPELINES= {

?? #'imagedownload.pipelines.ImagedownloadPipeline': 300,

??? 'scrapy.pipelines.images.ImagesPipeline': 1

}

?

IMAGES_STORE= os.path.join(os.path.dirname(os.path.dirname(__file__)), 'images')


Items.py?代碼


import scrapy

?

?

class ImagedownloadItem(scrapy.Item):

??? title = scrapy.Field()

??? # image_urls:是用來保存這個(gè)item上的突破的鏈接的

??? image_urls = scrapy.Field()

??? # images:是后期圖片下載完成后保存后形成image對象再保存到這個(gè)上面

??? images = scrapy.Field()


start.py?代碼


from scrapy import cmdline

?

cmdline.execute("scrapycrawl zcool".split(" "))


續(xù)上例兄淫,zcool.py?示例代碼


import scrapy

from scrapy.spiders.crawl import CrawlSpider, Rule

from scrapy.linkextractors import LinkExtractor

from ..items import ImagedownloadItem

?

?

class ZcoolSpider(CrawlSpider):

??? name = 'zcool'

??? allowed_domains = ['zcool.com.cn']

??? start_urls = ['http://zcool.com.cn/']

?

??? rules = (

???????# 翻頁的url

???????Rule(LinkExtractor(allow=".+0!0!0!0!0!!!!2!0!\d+"),follow=True),

???????# 詳情頁面的url

???????Rule(LinkExtractor(allow=".+/work/.+html"), follow=False,callback="parse_detail")

??? )

?

??? def parse_detail(self, response):

??????? image_urls =response.xpath("http://div[@class='reveal-work-wraptext-center']//img/@src").getall()

??????? title_list =response.xpath("http://div[@class='details-contitle-box']/h2/text()").getall()

??????? title ="".join(title_list).strip()

??????? item = ImagedownloadItem(title=title,image_urls=image_urls)

??????? yield item



上一篇文章 第六章 Scrapy框架(十二) 2020-03-14 地址:

http://www.reibang.com/p/fc0b7b7fc5c8

下一篇文章 第六章 Scrapy框架(十四) 2020-03-16 地址:

http://www.reibang.com/p/2febb184009d



以上資料內(nèi)容來源網(wǎng)絡(luò)饥悴,僅供學(xué)習(xí)交流,侵刪請私信我烟勋,謝謝障癌。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末意荤,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌刘绣,老刑警劉巖樱溉,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異纬凤,居然都是意外死亡福贞,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進(jìn)店門停士,熙熙樓的掌柜王于貴愁眉苦臉地迎上來挖帘,“玉大人,你說我怎么就攤上這事恋技∧匆ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵蜻底,是天一觀的道長骄崩。 經(jīng)常有香客問我,道長薄辅,這世上最難降的妖魔是什么要拂? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮站楚,結(jié)果婚禮上脱惰,老公的妹妹穿的比我還像新娘。我一直安慰自己窿春,他們只是感情好枪芒,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著谁尸,像睡著了一般舅踪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上良蛮,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天抽碌,我揣著相機(jī)與錄音,去河邊找鬼决瞳。 笑死货徙,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的皮胡。 我是一名探鬼主播痴颊,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼屡贺!你這毒婦竟也來了蠢棱?” 一聲冷哼從身側(cè)響起锌杀,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎泻仙,沒想到半個(gè)月后糕再,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡玉转,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年突想,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片究抓。...
    茶點(diǎn)故事閱讀 40,015評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡猾担,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出刺下,到底是詐尸還是另有隱情绑嘹,我是刑警寧澤,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布怠李,位于F島的核電站圾叼,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏捺癞。R本人自食惡果不足惜夷蚊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望髓介。 院中可真熱鬧惕鼓,春花似錦、人聲如沸唐础。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽一膨。三九已至呀邢,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間豹绪,已是汗流浹背价淌。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留瞒津,地道東北人蝉衣。 一個(gè)月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像巷蚪,于是被迫代替她去往敵國和親病毡。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容