python簡(jiǎn)易爬蟲(2)--應(yīng)對(duì)ajax

web中一項(xiàng)很對(duì)用戶體驗(yàn)重要的技術(shù)ajax

傳統(tǒng)的Web應(yīng)用允許用戶端填寫表單, 當(dāng)送出表單時(shí)就向網(wǎng)頁服務(wù)器發(fā)送一個(gè)請(qǐng)求。服務(wù)器接收并處理傳來的表單空镜，然后送回一個(gè)新的網(wǎng)頁丰嘉，但這個(gè)做法浪費(fèi)了許多帶寬洁灵，因?yàn)樵谇昂髢蓚€(gè)頁面中的大部分HTML碼往往是相同的房铭。
AJAX應(yīng)用可以僅向服務(wù)器發(fā)送并取回必須的數(shù)據(jù)，并在客戶端采用JavaScript處理來自服務(wù)器的回應(yīng)撤摸。因?yàn)樵诜?wù)器和瀏覽器之間交換的數(shù)據(jù)大量減少（大約只有原來的5%）

以上資料引用自維基百科

對(duì)于采用了ajax異步加載的網(wǎng)頁毅桃，一些信息無法直接在html源代碼中讀取，所以常見的download＋parse思路行不通准夷。對(duì)于應(yīng)對(duì)這種情況钥飞，強(qiáng)大的網(wǎng)友給出了兩大思路:

1.模擬瀏覽器行為，即執(zhí)行javascript代碼冕象，直接得到處理后的html文件再進(jìn)行解析代承。

可用的工具－－phantomjs＋selenium。其中phantomjs用于執(zhí)行js代碼渐扮，selenium是web自動(dòng)化測(cè)試工具（在這兒用于模擬用戶點(diǎn)擊網(wǎng)頁url的動(dòng)作）
優(yōu)勢(shì)：代碼量少论悴，通用性高掖棉。
劣勢(shì)：占用資源高，即耗時(shí)長(zhǎng)膀估。

2.分析ajax對(duì)應(yīng)的XMLHttpRequest(XHR)幔亥，數(shù)據(jù)總是在存數(shù)據(jù)庫中的，只要能分析出相應(yīng)的api就算達(dá)到目的了察纯。

可以借助chrome的開發(fā)者工具帕棉，右鍵->查看->network->xhr
優(yōu)勢(shì)：省流量，避免下載冗余html饼记，因此理論效率很高香伴。
劣勢(shì)：有可能分析不出來。

以上經(jīng)驗(yàn)來源于selenium+phantomjs, pyspider爬蟲教程

最后編輯于：2017.12.03 10:43:26

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末具则，一起剝皮案震驚了整個(gè)濱河市即纲，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌博肋，老刑警劉巖低斋，帶你破解...
沈念sama閱讀 216,919評(píng)論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異匪凡，居然都是意外死亡膊畴，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,567評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門病游，熙熙樓的掌柜王于貴愁眉苦臉地迎上來唇跨，“玉大人，你說我怎么就攤上這事礁遵∏峤剩” “怎么了？”我有些...
開封第一講書人閱讀 163,316評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵佣耐，是天一觀的道長(zhǎng)。經(jīng)常有香客問我唧龄，道長(zhǎng)兼砖，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,294評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任既棺，我火速辦了婚禮讽挟，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘丸冕。我一直安慰自己耽梅，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,318評(píng)論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布胖烛。她就那樣靜靜地躺著眼姐，像睡著了一般诅迷。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上众旗，一...
開封第一講書人閱讀 51,245評(píng)論 1贊 299
城市分裂傳說
那天罢杉，我揣著相機(jī)與錄音，去河邊找鬼贡歧。笑死滩租，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的利朵。我是一名探鬼主播律想，決...
沈念sama閱讀 40,120評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼绍弟！你這毒婦竟也來了技即？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,964評(píng)論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤晌柬，失蹤者是張志新（化名）和其女友劉穎姥份，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體年碘，經(jīng)...
沈念sama閱讀 45,376評(píng)論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡澈歉，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,592評(píng)論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了屿衅。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片埃难。...
茶點(diǎn)故事閱讀 39,764評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖涤久，靈堂內(nèi)的尸體忽然破棺而出涡尘，到底是詐尸還是另有隱情，我是刑警寧澤响迂，帶...
沈念sama閱讀 35,460評(píng)論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布考抄，位于F島的核電站，受9級(jí)特大地震影響蔗彤，放射性物質(zhì)發(fā)生泄漏川梅。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,070評(píng)論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一然遏、第九天我趴在偏房一處隱蔽的房頂上張望贫途。院中可真熱鬧，春花似錦待侵、人聲如沸丢早。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,697評(píng)論 0贊 22
一樁弒父案秧倾，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽怨酝。三九已至傀缩，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間凫碌，已是汗流浹背扑毡。一陣腳步聲響...
開封第一講書人閱讀 32,846評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留盛险，地道東北人瞄摊。一個(gè)月前我還...
沈念sama閱讀 47,819評(píng)論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像苦掘，于是被迫代替她去往敵國和親换帜。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,665評(píng)論 2贊 354

python簡(jiǎn)易爬蟲(2)--應(yīng)對(duì)ajax

推薦閱讀更多精彩內(nèi)容