一下模塊負責(zé)各功能:
connection redis 連接的文件
defaults 默認設(shè)置文件
dupefilter 用來過濾 替換srapy默認的去重器
picklecompat 用來做序列化的
piplines 將item保存到redis中
queue 實現(xiàn)了三種隊列 做requests隊列 先進先出隊列 優(yōu)先級隊列 先進后出隊列 對應(yīng)scrapy的隊列
scheduler URL調(diào)度器
spiders 讀取start_urls 是通過redis讀取的 所以這邊也不一樣
utils 做py3兼容