目錄
- 瞎比比
- 舉個(gè)栗子疯特?
- 開(kāi)始分析
- 寒假作業(yè)
- 又瞎比比
瞎比比
之前寫(xiě)了《》這篇文章,其中有些參數(shù)蔼囊,如果不查看其 JS 代碼,是無(wú)法知道它是怎么來(lái)的衣迷。說(shuō)到這里畏鼓,我們來(lái)看看啥是反爬蟲(chóng)?某度如是說(shuō):
他們根據(jù)ip訪問(wèn)頻率壶谒,瀏覽網(wǎng)頁(yè)速度云矫,賬戶登錄,輸入驗(yàn)證碼汗菜,flash封裝让禀,ajax混淆,js加密陨界,圖片巡揍,css混淆等五花八門(mén)的技術(shù),來(lái)對(duì)反網(wǎng)絡(luò)爬蟲(chóng)菌瘪。
這篇文章還不涉及加密腮敌,只是查看一些參數(shù)的所以然,所以說(shuō)還是比較基礎(chǔ)的麻车,后面再來(lái)說(shuō)說(shuō)加密缀皱。
舉個(gè)栗子?
那么現(xiàn)在我們就來(lái)說(shuō)說(shuō)动猬,這些參數(shù)是怎么來(lái)的啤斗。下圖是我上一篇文章的一個(gè)分析點(diǎn)。例如:jsonpCallback
在開(kāi)始分析之前赁咙,我默認(rèn)你已經(jīng)掌握了 JavaScript 钮莲,并且達(dá)到了一定的程度,否則你是看不懂 JS 代碼的彼水。
開(kāi)始分析
請(qǐng)將你的 Chrome 瀏覽器打開(kāi)至如上圖效果崔拥,即是右鍵 --> 檢查 ,到這一步呢凤覆,你是還沒(méi)有打開(kāi)圖中的紅框部分的链瓦。這時(shí)候,再按一下: Ctrl + Shift + F(Windows)紅框部分就出來(lái)了,Mac 的快捷鍵我也不知道慈俯,如果你知道渤刃,還煩請(qǐng)告訴一下我。
接下來(lái)呢贴膘,在紅框部分的搜索欄中輸入:jsonCallback
現(xiàn)在卖子,下面出現(xiàn)了一堆搜索內(nèi)容。我們需要做的刑峡,就是從這些代碼中找到我們想要的東西 -- 即是 jsonCallback 是怎么來(lái)的洋闽?有時(shí)候,運(yùn)氣好突梦,你在第一條搜索結(jié)果中就找到了答案诫舅,運(yùn)氣差點(diǎn),可能就得翻完所有代碼阳似。我們雙擊選擇第一條結(jié)果骚勘。
未格式化的代碼可讀性是很差的,看了也基本懵逼〈樽啵現(xiàn)在俏讹,在格式化的代碼中搜索:jsonCallback
如果沒(méi)有看到想要的結(jié)果,則繼續(xù)查找下一個(gè)畜吊,或者下一個(gè)代碼文件
查找過(guò)程我就不一一解說(shuō)了泽疆,最后我們?cè)诘谝粋€(gè)文件中就能找到我們想要的結(jié)果,如下圖:
到這一步玲献,結(jié)果就出來(lái)了殉疼,其實(shí)就是一些隨機(jī)數(shù)的拼接。
寒假作業(yè)
分析下圖中捌年,參數(shù) entryIds 是怎么來(lái)的瓢娜?(這個(gè)參數(shù)要翻頁(yè)之后,才會(huì)出現(xiàn))
又瞎比比
如果這篇文章你漲知識(shí)了礼预,點(diǎn)個(gè)好看可好眠砾?這是對(duì)我最好的支持。下一篇托酸,繼續(xù)分享反爬蟲(chóng)系列褒颈。盡請(qǐng)期待!