一、爬蟲基礎(chǔ)
二杂曲、基礎(chǔ)庫的使用
??1. urllib庫
??2. requests庫
三或颊、網(wǎng)頁解析方式
??1. 正則表達(dá)式:re模塊
??2. xpath語法和lxml庫
??3. BeautifulSoup4用法
四、數(shù)據(jù)庫的使用
??1. Mysql數(shù)據(jù)庫
??2. MongoDB數(shù)據(jù)庫
??3.Redis數(shù)據(jù)庫
五咪奖、爬蟲進階
??1. 多線程與多進程
??2. Ajax數(shù)據(jù)爬取原理
??3. Ajax數(shù)據(jù)爬取實戰(zhàn)--以拉勾網(wǎng)為例
??4. 驗證碼的識別
六赊锚、Python爬蟲框架
??1. pyspider框架
??2. scrapy框架
七治筒、分布式爬蟲
??1. scrapy-redis框架
八、其他
??1. Linux基礎(chǔ)
??2. Python基礎(chǔ)
??3. 數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ)
??4. JavaScript基礎(chǔ)
??5. 數(shù)據(jù)分析與機器學(xué)習(xí)