需要加強學習并持續(xù)復習的庫
- urllib
- requests
- BeautifulSoup
- PyQuery(用的比較少)
- Selenium
- Scrapy
- peewee (ORM)
- pymysql
- 數(shù)據(jù)庫結(jié)構(gòu)設(shè)計
需要學習的庫
- base4(加密解密)
- threading(多線程)
- multiprocessing(多進程)
- datetime/time(時間處理)
- PIL(圖像處理)
- codecs
- hashlib
- Jquery
- Twisted(異步通信)
- pickle(序列化)
- fake_useragent(隨機user agent)
- scrapy_crawlera (代理IP)
需要學習的方法
- bytes()
- BytesIO()
需要學習的知識
http協(xié)議召廷,書籍:《HTTP權(quán)威指南》
進程線程協(xié)程
同步異步积暖,阻塞非阻塞
Javascript