整體思考 分為如下三個模塊:采集-過濾-存儲章钾。 各個模塊相互獨立抖拦,按照需求可定制開發(fā)雀摘,不同模塊組裝起來滿足不同需求吗货。 三個模塊組合簡單混槐,只需修改配置實現(xiàn)不同網站爬取督勺。 思路.png 擴展 支持增量爬取 支持中斷注簿,重啟繼續(xù)爬取 結束 追求極簡待锈,完美的不如適合自己的湖员。