當item進入pipeline的時候就要經過一個個管道规阀,入庫或者進行其他作用队伟。先介紹scrapy內置的Pipeline圖片管道和文件管道
圖片管道
首先如果要用圖片管道那么就必須啟用item葵礼,用item對象才能完成對圖片的讀寫
在items文件中的某一個Item類中胁住,我們需要img_urls和images作為成員變量
img_urls裝載的是圖片鏈接层宫,
images是不需要在spider中被賦值的学密,在圖片管道文件中揭蜒,如果這個images對應的img_urls是正確的横浑,那么下載到的圖片信息會傳遞給這個images
在settings文件中,我們要指出他的存儲路徑屉更,用
IMAGES_STORE這個名字(不能亂改的)
并且可以在IMAGES_MIN_HEIGHT和IMAGES_MIN_WIDTH中設置圖片的最小寬度和長度設定好這些就直接開始爬就完事兒了
IMAGES_EXPIRES可以設置有效的圖片時間徙融,這個90天中是不會再一次下載這個圖片
IMAGES_THUMBS這個可以設置縮略圖