github:https://github.com/XIAOBEIJIEKOU/Sprider
Beautiful Soup 3 目前已經(jīng)停止開發(fā),推薦在現(xiàn)在的項目中使用Beautiful Soup 4山宾,不過它已經(jīng)被移植到BS4了笔咽,也就是說導(dǎo)入時我們需要 import bs4 。所以這里我們用的版本是 Beautiful Soup 4.3.2 (簡稱BS4)蔫巩,另外據(jù)說 BS4 對 Python3 的支持不夠好谆棱,不過我用的是 Python2.7.7,如果有小伙伴用的是 Python3 版本圆仔,可以考慮下載 BS3 版本垃瞧。
BeautifulSoup(markup, “html.parser”)? ?[?“html.parser”]是python自帶的html解析器,另一個可供選擇的解析器是純Python實現(xiàn)的 html5lib , html5lib的解析方式與瀏覽器相同,但是速度慢
https://cuiqingcai.com/1319.html
抓包(packet capture)就是將網(wǎng)絡(luò)傳輸發(fā)送與接收的數(shù)據(jù)包進行截獲坪郭、重發(fā)个从、編輯、轉(zhuǎn)存等操作,也用來檢查網(wǎng)絡(luò)安全嗦锐。抓包也經(jīng)常被用來進行數(shù)據(jù)截取等嫌松。
anaconda【安娜叩達】指的是一個開源的Python發(fā)行版本,其包含了conda奕污、Python等180多個科學(xué)包及其依賴項萎羔。[1]?因為包含了大量的科學(xué)包,Anaconda 的下載文件比較大(約 500 MB)碳默,如果只需要某些包贾陷,或者需要節(jié)省帶寬或存儲空間,也可以使用Miniconda這個較小的發(fā)行版(僅包含conda和 Python)