Instruction
1、用scrapy框架編寫(xiě),抓取試卷及試題
2劲室、相關(guān)模塊
BeautifulSoup4
伦仍、Pillow
、lxml
很洋、baidu-aip
...
3呢铆、圖片下載,圖片文字識(shí)別
4蹲缠、MySQL棺克、Redis、MongoDB數(shù)據(jù)庫(kù)存儲(chǔ)
5线定、多管道處理
Usage
1娜谊、切換到工作目錄
cd zujuan
2、運(yùn)行spider
scrapy crawl `spiderName`