老師上幾周布置的爬蟲作業(yè),雖然當周就完成了谓媒,不過一直有個問題沒有解決,寫入CSV的時候數(shù)據(jù)會自動覆蓋达传,導(dǎo)致只能保留10條爬取的數(shù)據(jù)篙耗。
就在昨晚,為了完成另一個作業(yè)宪赶,請同學(xué)幫忙把python庫弄了個底朝天宗弯,對于代碼白癡的我來說也總算明白了一些原理,非常感謝這位同學(xué)搂妻!
然而就在今天重新把爬蟲代碼拿出來修改的時候蒙保,程序一運行,問題就出現(xiàn)了:
pycharm報錯:
bs4.FeatureNotFound: Couldn’t find a tree builder with the features you requested: html_parser. Do you need to install a parser library?
經(jīng)過一輪查找終于找到了解決方案:
先用pip uninstall lxml卸載欲主,再用pip install lxml安裝邓厕,這么做就可以了。
簡直完美解決問題扁瓢!
方法來自CSND博客:
謝謝這位碼友O昴铡!
想說一下關(guān)于系統(tǒng)環(huán)境變量的事情引几,其實也沒什么好說的昧互,如果碰到這種問題,一般就是pip所在的路徑?jīng)]有添加到環(huán)境變量中去伟桅。
當然敞掘,不添加到環(huán)境變量中也行,就需要在cmd命令行中手動輸入跳到pip的路徑下來執(zhí)行pip
環(huán)境變量個人理解就是楣铁,讓系統(tǒng)幫保持打開這些已經(jīng)添加的路徑玖雁,方便運行某一程序。