網(wǎng)絡(luò)爬蟲中Fiddler抓取PC端網(wǎng)頁數(shù)據(jù)包與手機(jī)端APP數(shù)據(jù)包

1 引言

  在編寫網(wǎng)絡(luò)爬蟲時(shí)俭缓,第一步(也是極為關(guān)鍵一步)就是對(duì)網(wǎng)絡(luò)的請(qǐng)求(request)和回復(fù)(response)進(jìn)行分析克伊,尋找其中的規(guī)律,然后才能通過網(wǎng)絡(luò)爬蟲進(jìn)行模擬华坦。瀏覽器大多也自帶有調(diào)試工具可以進(jìn)行抓包分析愿吹,但是瀏覽器自帶的工具比較輕量,復(fù)雜的抓包并不支持惜姐。且有時(shí)候需要編寫手機(jī)APP爬蟲犁跪,這時(shí)候就必須需要用到其他的專業(yè)抓包工具,例如本篇介紹的Fiddler歹袁。

Python學(xué)習(xí)資料或者需要代碼坷衍、視頻加Python學(xué)習(xí)群:960410445

2 Fiddler簡(jiǎn)介

  Fiddler是位于客戶端和服務(wù)器端的HTTP代理,也是目前最常用的http抓包工具之一,它能夠記錄客戶端和服務(wù)器之間的所有 HTTP請(qǐng)求条舔,可以針對(duì)特定的HTTP請(qǐng)求枫耳,分析請(qǐng)求數(shù)據(jù)、設(shè)置斷點(diǎn)逞刷、調(diào)試web應(yīng)用嘉涌、修改請(qǐng)求的數(shù)據(jù)妻熊,甚至可以修改服務(wù)器返回的數(shù)據(jù)夸浅,功能非常強(qiáng)大,是web調(diào)試的利器扔役。

當(dāng)然帆喇,除了Fiddler之外,抓包工具還有Firebug亿胸、Wireshark坯钦、Httpwatch等,為什么我們要選擇fiddler呢侈玄?原因如下:

 ⊥竦丁(1)Firebug雖然可以抓包,但是對(duì)于分析http請(qǐng)求的詳細(xì)信息序仙,不夠強(qiáng)大突颊。模擬http請(qǐng)求的功能也不夠,且firebug常常是需要“無刷新修改”潘悼,如果刷新了頁面律秃,所有的修改都不會(huì)保存。

 ≈位健(2)Wireshark是通用的抓包工具棒动,但是比較龐大,對(duì)于只需要抓取http請(qǐng)求的應(yīng)用來說宾添,似乎有些大材小用船惨,總有一點(diǎn)殺雞用牛刀的感覺柜裸。

  (3)Httpwatch也是比較常用的http抓包工具粱锐,但是只支持IE和firefox瀏覽器(其他瀏覽器可能會(huì)有相應(yīng)的插件)粘室,對(duì)于想要調(diào)試chrome瀏覽器的http請(qǐng)求,似乎稍顯無力卜范,而Fiddler 是一個(gè)使用本地 127.0.0.1:8888 的 HTTP 代理衔统,任何能夠設(shè)置 HTTP 代理為 127.0.0.1:8888 的瀏覽器和應(yīng)用程序都可以使用 Fiddler。

3 Fiddler界面介紹

  Fiddler界面如下:

Fiddler界面左側(cè)的小窗口列表展示的是所有Fiddler抓取的包海雪,各個(gè)包每個(gè)字段還有圖標(biāo)的含義如下表所示:

數(shù)據(jù)包屬性第一列的圖標(biāo)含義如下表所示:

Fiddler界面右側(cè)是用來顯示選中數(shù)據(jù)報(bào)的詳細(xì)信息锦爵,上半部分顯示的是數(shù)據(jù)報(bào)的請(qǐng)求信息,下半部分顯示的是回復(fù)信息:

4 PC端網(wǎng)頁會(huì)話數(shù)據(jù)包捕獲

4.1 HTTP會(huì)話數(shù)據(jù)包捕獲

Fiddler打開后奥裸,會(huì)自動(dòng)將瀏覽器代理設(shè)置為“127.0.0.1:8888”险掀,關(guān)閉時(shí)自動(dòng)修改為原來的代理,這一點(diǎn)上Fiddler還是比較方便的湾宙。當(dāng)然你也可以手動(dòng)設(shè)置瀏覽器代理樟氢。開始抓包是必須確保猜到了file下的Capture Traffic是勾選上的,當(dāng)然也可以通過下方的Capturing按鈕開啟或關(guān)閉侠鳄。

所以埠啃,若是要捕獲HTTPS協(xié)議會(huì)話信息,要進(jìn)行進(jìn)一步的配置伟恶。配置過程如下:

第一步:打開Tools – Options碴开,然后將彈出窗口內(nèi)HTTPS選項(xiàng)下的所有可選項(xiàng)都勾選上。

?  有的網(wǎng)上教程說到此點(diǎn)擊OK就可以了博秫,但事實(shí)證明潦牛,如果就設(shè)置到這一步,打開HTTPS網(wǎng)頁會(huì)失敗挡育,出現(xiàn)警告“您的連接并不安全”巴碗,如下圖所示。所以還要進(jìn)行第二步操作即寒。

  第二步:還是在第一步中打開的彈出窗口內(nèi)橡淆,點(diǎn)擊action,然后選擇第二項(xiàng)蒿叠,將證書到處到桌面明垢。

?  第三步:打開firefox瀏覽器,選項(xiàng)-隱私與安全市咽,在最下面找到證書設(shè)置項(xiàng)痊银,點(diǎn)擊“查看證書”,導(dǎo)入在第二步中到處到桌面的證書施绎,勾選兩個(gè)信任之后確認(rèn)退出溯革。

此時(shí)贞绳,再次打開百度首頁,查看Fiddler捕獲的信息致稀,發(fā)現(xiàn)可以正常訪問百度冈闭,且Fiddler沒有報(bào)警報(bào)信息,且成功捕獲如下所示:?

5 手機(jī)端APP會(huì)話信息采集

  除了采集電腦瀏覽器的網(wǎng)頁會(huì)話外抖单,F(xiàn)iddler還能采集手機(jī)APP的會(huì)話信息萎攒。當(dāng)然,這還是需要經(jīng)過一番設(shè)置才行矛绘。步驟如下:

  第一步:用電腦開啟一個(gè)無線網(wǎng)(360WiFi耍休、獵豹wifi等都可以實(shí)現(xiàn)),然后讓手機(jī)通過電腦開啟的無線網(wǎng)上網(wǎng)货矮。

  第二步:依次點(diǎn)擊打開Tools-Options-Connections羊精,然后勾選第二項(xiàng)“Allow remote compute to connect”。

  第三步:到手機(jī)中將手機(jī)的網(wǎng)絡(luò)代理改為電腦的fiddler囚玫。首先查看電腦的ip地址喧锦,然后在手機(jī)中一次打開“設(shè)置-無線和網(wǎng)絡(luò)-wlan”,連接上電腦上剛創(chuàng)建的無線網(wǎng)抓督,然后長(zhǎng)按該無線網(wǎng)燃少,依次點(diǎn)擊“修改網(wǎng)絡(luò)-顯示高級(jí)設(shè)置-代理-手動(dòng)”,將服務(wù)器主機(jī)名設(shè)置為電腦的ip地址本昏,端口設(shè)置為8888供汛。如下圖所示:

  設(shè)置好后,我們Fiddler就可以成功捕獲手機(jī)APP的會(huì)話信息了涌穆。

6 會(huì)話過濾功能

  當(dāng)我們打開Fiddler進(jìn)行會(huì)話捕獲時(shí),在默認(rèn)情況下雀久,F(xiàn)iddler會(huì)不會(huì)所有的會(huì)話宿稀,這樣就造成不會(huì)的會(huì)話過多,不利于我們分析赖捌,這時(shí)候我們可以用到Filters功能進(jìn)行會(huì)話過濾祝沸。Filters三種過濾模式供選擇:

  No Host Filter:不設(shè)置域名過濾;

  Hide the following Hosts:設(shè)置的這些域名相關(guān)會(huì)話將在左側(cè)會(huì)話列表中被隱藏越庇;

  Show only the following Hosts:只在會(huì)話列表中顯示與設(shè)置的這些域名相關(guān)的會(huì)話罩锐;

  Flag the following Hosts:與設(shè)置的域名相關(guān)會(huì)話將在左側(cè)會(huì)話列表中高亮想顯示。

  如果要設(shè)置多個(gè)域名卤唉,域名之間用分號(hào)分開涩惑。切記,選好后要點(diǎn)擊Actions按鈕桑驱,然后點(diǎn)擊Runfiltersets now讓設(shè)置生效竭恬。如果我們只想顯示百度和CSDN的會(huì)話信息跛蛋,設(shè)置過程如下圖所示:

7 總結(jié)

  Fiddler是一個(gè)功能強(qiáng)大的網(wǎng)絡(luò)抓包工具,本文對(duì)如何用Fiddler抓取HTTP痊硕、HTTPS赊级、手機(jī)APP會(huì)話數(shù)據(jù)報(bào)介紹了,另外還補(bǔ)充介紹了數(shù)據(jù)包過濾的功能岔绸。當(dāng)然理逊,F(xiàn)iddler的功能遠(yuǎn)不止這些,不過本文介紹的操作用于一般的網(wǎng)絡(luò)爬蟲數(shù)據(jù)包分析足以盒揉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末挡鞍,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子预烙,更是在濱河造成了極大的恐慌墨微,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件扁掸,死亡現(xiàn)場(chǎng)離奇詭異翘县,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)谴分,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門锈麸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人牺蹄,你說我怎么就攤上這事忘伞。” “怎么了沙兰?”我有些...
    開封第一講書人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵氓奈,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我鼎天,道長(zhǎng)舀奶,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任斋射,我火速辦了婚禮育勺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘罗岖。我一直安慰自己涧至,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開白布桑包。 她就那樣靜靜地躺著南蓬,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蓖康,一...
    開封第一講書人閱讀 51,692評(píng)論 1 305
  • 那天铐炫,我揣著相機(jī)與錄音,去河邊找鬼蒜焊。 笑死倒信,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的泳梆。 我是一名探鬼主播鳖悠,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼优妙!你這毒婦竟也來了乘综?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤套硼,失蹤者是張志新(化名)和其女友劉穎卡辰,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邪意,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡九妈,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了雾鬼。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片萌朱。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖策菜,靈堂內(nèi)的尸體忽然破棺而出晶疼,到底是詐尸還是另有隱情,我是刑警寧澤又憨,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布翠霍,位于F島的核電站,受9級(jí)特大地震影響竟块,放射性物質(zhì)發(fā)生泄漏壶运。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一浪秘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧埠况,春花似錦耸携、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至喜命,卻和暖如春沟沙,著一層夾襖步出監(jiān)牢的瞬間河劝,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來泰國打工矛紫, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赎瞎,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓颊咬,卻偏偏與公主長(zhǎng)得像务甥,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子喳篇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容