爬蟲網(wǎng)絡(luò)請(qǐng)求之JS解密三(中國(guó)裁判文書網(wǎng)中)

- 前言

中國(guó)裁判文書網(wǎng)的反爬策略也是對(duì)爬蟲們毫不憐惜耳贬,今天給大家簡(jiǎn)單講一下關(guān)于裁判文書網(wǎng)中的js加密問題,分為兩部分來講丸氛,方便大家了解學(xué)習(xí)罚舱。還是老規(guī)矩井辜,僅供學(xué)習(xí)參考,切勿用于商業(yè)用途管闷。

一粥脚、介紹

打開裁判文書網(wǎng),發(fā)現(xiàn)瀏覽器訪問不了List頁面包个,只好改用火狐瀏覽器刷允。進(jìn)入到List頁面(也就是可以看到很多案件的那一頁),發(fā)現(xiàn)是Ajax異步更新頁面,也就是說它用JS來加載更新數(shù)據(jù)树灶,而不更新整個(gè)頁面纤怒。那么我們只有兩種方案,一種是用selenium+瀏覽器天通,來驅(qū)動(dòng)瀏覽器來加載數(shù)據(jù)泊窘,但是此方案效率非常感人,如果采集數(shù)據(jù)量大或更新頻率高土砂,非常不推薦這種方式州既。另一種就是找數(shù)據(jù)加載的接口位置谜洽,這里不明白的可以看我之前的文章python爬蟲項(xiàng)目(新手教程)之知乎萝映。這一步一般都會(huì)有JS加密來防范爬蟲。

二阐虚、頁面分析

我們先找到案件數(shù)據(jù)加載的接口位置序臂,如圖2-1所示:


圖2-1 數(shù)據(jù)加載接口

找到接口位置后,查看請(qǐng)求方式為post实束,那么意味著我們需要參數(shù)訪問奥秆。我們先看此頁面的cookies,后面會(huì)需要用到咸灿,如圖2-2所示:


圖2-2 接口cookie

這里的vjkl5构订,后面會(huì)用到,先圈出來避矢。我們接下來查看post請(qǐng)求參數(shù)悼瘾,如圖2-3 所示:
圖2-3 接口請(qǐng)求表單參數(shù)

這里的參數(shù)前面都很好理解,Param:案件類型审胸,Index:索引頁面亥宿,Page:設(shè)置當(dāng)前頁面數(shù)據(jù)請(qǐng)求條數(shù),Order:是哪個(gè)級(jí)別砂沛,Direction:返回文件格式烫扼。后面三個(gè)參數(shù)vl5x,number碍庵,guid不知道是什么意義映企,其它的可以自己選擇設(shè)置,所以我們今天我們需要做的就是找到這三個(gè)參數(shù)的獲取方式静浴。

三堰氓、JS加密研究

我們既然知道是JS方式加載的參數(shù),所以檢索所有加載的JS文件马绝,找到vl5x和guid兩個(gè)關(guān)鍵字豆赏。這一步?jīng)]什么好方法,地毯式搜索≈腊睿總共38個(gè)JS文件白胀,從Lawyee.CPWSW.List.js 文件找到如下代碼如圖3-1所示:


圖3-1 JS參數(shù)內(nèi)容

可以看到data里面寫了所有參數(shù)獲取位置,我們先看number抚岗,同樣在這個(gè)js文件的代碼中順著number:yzm1或杠,可以發(fā)現(xiàn)如圖3-2所示:


圖3-2 number參數(shù)獲取方式

可以順著發(fā)現(xiàn),number等于yzm1宣蔚,yzm1等于subyzm[7,11]向抢,subyzm又為當(dāng)前鏈接url下&number參數(shù)坐標(biāo)+1位置開始的子串subyzm,如當(dāng)前鏈接為http://wenshu.court.gov.cn/Assets/js/20180919/Lawyee.CPWSW.List.js胚委,沒有&number所以坐標(biāo)為-1+1挟鸠,subyzm=url[0:],yzm1=subyzm[7:11]=wens亩冬,大家不理解可以看下JS代碼艘希,我這里翻譯成python語言是這樣。
這樣我們找到了number硅急,同樣方法在此文件下檢索guid覆享,發(fā)現(xiàn)如圖3-3所示:

圖3-3 guid參數(shù)獲取方式

很容易發(fā)現(xiàn)guid等于guid1,guid1又等于幾個(gè)createGuid( )組合起來的一串?dāng)?shù)字营袜,而CreateGuid函數(shù)也已經(jīng)給出撒顿,隨機(jī)數(shù)字產(chǎn)生。
這樣我們只需要找到vl5x就可以了荚板,這個(gè)放最后講也是因?yàn)檫@個(gè)參數(shù)最麻煩凤壁,在當(dāng)前文件下,我們根據(jù)圖3-1只能知道vl5x:getKey()啸驯,我們只要找到getKey()這個(gè)函數(shù)即可客扎,但是此文件沒有找到getKey( )罚斗,意味著這是一個(gè)外部函數(shù)徙鱼。我們需要從其它文件下獲取。
同樣针姿,我們一個(gè)一個(gè)搜索著getKey()函數(shù)袱吆,在Lawyee.CPWSW.ListExtend.js文件下找到如圖3-4所示:
圖3-4 getKey函數(shù)定義

我們得到這個(gè)參數(shù)了,想要和之前一樣去讀懂這個(gè)函數(shù)是不可能的了距淫,因?yàn)椴粌H非常長(zhǎng)非常長(zhǎng)绞绒,而且還有JS混淆,關(guān)于js混淆榕暇,就是把其中的變量蓬衡、方法位置順序打亂喻杈,但是又用一些無關(guān)的變量或者方法來保證執(zhí)行順序,這種js混淆的也很好處理狰晚,復(fù)制完整的混淆代碼去js混淆還原網(wǎng)站還原筒饰。也可以利用chrome中的Console后臺(tái)調(diào)試JS代碼了,直接copy這段代碼進(jìn)去發(fā)現(xiàn)如圖3-5所示:
圖3-5 測(cè)試getKey函數(shù)

發(fā)現(xiàn)de沒有定義壁晒,我們?cè)诖宋募l(fā)現(xiàn)de函數(shù)定義后瓷们,加進(jìn)去發(fā)現(xiàn)如圖3-6所示:
圖3-6 加入de函數(shù)后

其中_fxxx沒有,我們又找到_fxxx定義后加入發(fā)現(xiàn)如圖3-7所示:
圖3-7 加入_fxxx函數(shù)后

我們發(fā)現(xiàn)這里要獲取網(wǎng)頁Cookie值秒咐,但是JS代碼發(fā)現(xiàn)如圖3-8所示:
圖3-8 getCookie代碼

這是一段加密的JS代碼谬晕,根本看不到什么意思,但是用chrome瀏覽器source可以看到其中真正的代碼携取,這里要如何使用呢攒钳,就是調(diào)試的時(shí)候設(shè)置斷點(diǎn),這樣到這里就可以顯示出來歹茶,當(dāng)然也可以去js混淆網(wǎng)站去解密也可以看到相關(guān)內(nèi)容夕玩,這里在chrome調(diào)試下發(fā)現(xiàn)如圖3-9所示:
圖3-9 加密的Js代碼

這里的cookie值要去得到cookie中vjkl5的值,所以我們要想得到vl5x這個(gè)參數(shù)惊豺,事先還必須得到網(wǎng)站給我請(qǐng)求加的cookies上vjkl5的值才行。然后我們?cè)谶@里需要改寫這段代碼禽作,方法也很簡(jiǎn)單尸昧,在此函數(shù)前自定義一個(gè)getCookie的函數(shù),直接返回我們獲取到的cookies上vjkl5的值旷偿,這里我們以參數(shù)的形式傳進(jìn)去烹俗,改寫如圖3-10所示:
圖3-10 getKey函數(shù)改寫

加入我們自定義的getCookie方法后,我們繼續(xù)測(cè)試萍程,調(diào)試代碼幢妄,輸入getKey(‘123’)發(fā)現(xiàn)如圖3-11所示:
圖3-11 加入getCookie后

繼續(xù)缺少函數(shù),這里我們找hex_md5茫负,發(fā)現(xiàn)在/Assets/js/dist/libs/md5.js文件下蕉鸳,我們繼續(xù)copy下來,放入進(jìn)去調(diào)試忍法。如圖3-12所示:
圖3-12 放入hex_md5函數(shù)

到這里基本上就是重復(fù)以上步驟潮尝,找到所缺函數(shù)定義位置,加入進(jìn)去饿序。這里找到Base64函數(shù)定義勉失,放進(jìn)去
就可以驚喜發(fā)現(xiàn),代碼運(yùn)行成功原探。這里我們加入之前圖2-2所展示的cookie值vjkl5的值放進(jìn)去乱凿,結(jié)果如圖3-13所示:
圖3-13 代碼調(diào)試成功

比對(duì)2-2和2-3的cookie和vl5x參數(shù)顽素,發(fā)現(xiàn)結(jié)果正確。到此我們已經(jīng)將所需要的關(guān)鍵參數(shù)全部集齊徒蟆。

四戈抄、代碼實(shí)現(xiàn)

代碼放上來就被簡(jiǎn)書網(wǎng)管查水表了,后面會(huì)一起放在Github上后专,整理好后會(huì)貼出來划鸽。當(dāng)然這些不重要,重要的是加密的方式和解密的思路以及手段戚哎。
運(yùn)行結(jié)果如圖4-1所示:


圖4-1 運(yùn)行結(jié)果圖

結(jié)語

中國(guó)裁判文書網(wǎng)目前作為全球最大的裁判文書網(wǎng)站裸诽,每天面臨的訪問量也是非常巨大,反爬嚴(yán)密也是可以看出來型凳,之前也做過一次解密丈冬,不過此次反爬策略又全面更新了一次,訪問前要經(jīng)過360安域排查甘畅,文書ID做了加密埂蕊,JS混淆加密,jsfuck加密疏唾,隨機(jī)參數(shù)也做了一些修改蓄氧,下一次會(huì)給大家分享關(guān)于對(duì)裁判文書網(wǎng)文書ID加密研究的過程講解。如果大家有什么問題槐脏,歡迎一起學(xué)習(xí)探討喉童。

如果您喜歡我的文章,請(qǐng)關(guān)注或點(diǎn)擊喜歡顿天,您的支持是我最大的動(dòng)力 ^ ^~!
僅供學(xué)習(xí)參考堂氯,切勿用于商業(yè)用途
轉(zhuǎn)載請(qǐng)注明作者及其出處

黑羊的皇冠 簡(jiǎn)書主頁

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市牌废,隨后出現(xiàn)的幾起案子咽白,更是在濱河造成了極大的恐慌,老刑警劉巖鸟缕,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件晶框,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡叁扫,警方通過查閱死者的電腦和手機(jī)三妈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來莫绣,“玉大人畴蒲,你說我怎么就攤上這事《允遥” “怎么了模燥?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵咖祭,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我蔫骂,道長(zhǎng)么翰,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任辽旋,我火速辦了婚禮浩嫌,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘补胚。我一直安慰自己码耐,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布溶其。 她就那樣靜靜地躺著骚腥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪瓶逃。 梳的紋絲不亂的頭發(fā)上束铭,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音厢绝,去河邊找鬼契沫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛代芜,可吹牛的內(nèi)容都是我干的埠褪。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼挤庇,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了贷掖?” 一聲冷哼從身側(cè)響起嫡秕,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎苹威,沒想到半個(gè)月后昆咽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡牙甫,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年掷酗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片窟哺。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡泻轰,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出且轨,到底是詐尸還是另有隱情浮声,我是刑警寧澤虚婿,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站泳挥,受9級(jí)特大地震影響然痊,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜屉符,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一剧浸、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧矗钟,春花似錦唆香、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至秸应,卻和暖如春虑凛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背软啼。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工桑谍, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人祸挪。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓锣披,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親贿条。 傳聞我的和親對(duì)象是個(gè)殘疾皇子雹仿,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容