????今天遇到一個問題,爬取一個網(wǎng)站的數(shù)據(jù),只是提取出來一個鏈接就可以了,但是,有點意思的是,直接訪問該網(wǎng)站的時候并沒有找到我需要的鏈接地址,必須再進行一個格式轉換再次提取才ok.but,這是我把所有頁面鏈接都提取出來之后才知道的.因為我也是幫朋友找這些東西,,
我觀察了一下,其實很簡單,就是在Local Storage里面有一個value改一下格式,再訪問就可以直接找到想要的了.
然后.我大致思路就是先把一個網(wǎng)站提取出來,再修改它的Local Storage,最后提取出來之后,再批量,so easy 呀!
然而,卻遇到一個很麻煩的問題,因為第一次遇到,挺難受的,但是,既然遇到了還是要解決的.
我先描述一下問題
? ? ? ? 在Local Storage里面,本來就是key:value的形式存放數(shù)據(jù).
就是這樣:
但是,當我去修改那個value的時候,卻不知道怎么提取,因為這個value是這樣式的:.........
[{{{{{}}}}}]
但最外面就是一個列表,所以我可以直接就當成列表來用方法很簡單:
我擦,我又發(fā)現(xiàn)了個問題,取出來的value雖然是個[ ]格式,但是type竟然是str????
WHT???
然后直接:
問題不大,哈哈哈哈哈哈哈后續(xù)有問題繼續(xù)記錄
其實,我也沒必要糾結這個,如果正則直接提取出來那個字段是不是可以簡單點呢,,,,