在嘗試了用scrapy爬條法司網(wǎng)站上的雙邊條約后涎跨,我發(fā)現(xiàn)邑彪,這個(gè)網(wǎng)站的爛結(jié)構(gòu)讓我吃夠了苦铭段。在網(wǎng)站上有個(gè)表格骤宣,表中列出了中國與其他國家簽訂的104個(gè)雙邊條約,可是我試了幾次序愚,只下了九十個(gè)憔披。后來一看,其中有一部分是PDF爸吮,氣死人了芬膝。而在其列表頁中,也是錯(cuò)誤百出形娇,歐洲國家只列出了三個(gè)國家的條約锰霜。無奈,我只好在網(wǎng)站中搜索桐早,卻發(fā)現(xiàn)搜索結(jié)果用了JS锈遥∪沂拢苦啊∷模看了一些資料丽惶,我發(fā)現(xiàn)飼養(yǎng)蟲子的路還有很長一段啊。網(wǎng)站推薦了Selenuim神器爬立。在安裝中時(shí)钾唬,我又經(jīng)歷了一番折騰,才搞定侠驯。我得趕緊記下來抡秆,供各位小白飼養(yǎng)員們參考。
安裝Python下的selenium工具吟策,很容易儒士。
pip install selenium
安裝谷歌的Chromedriver,有個(gè)坑檩坚,大家要小心着撩。
第一,下載時(shí)一定要看清楚你的谷歌瀏覽器版本號(hào)匾委。
第二拖叙,下載了driver之后,一定要放在python的目錄下赂乐。