4種Python爬蟲(3. 微信小程序,如枪向,超級(jí)猩猩)

上一篇我們通過(guò)H5網(wǎng)頁(yè)爬取了數(shù)據(jù)勤揩,可以越來(lái)越多的公司連H5網(wǎng)頁(yè)都不提供,只提供了微信小程序秘蛔,本文我們來(lái)試試怎么爬取陨亡。

目錄:
1. PC網(wǎng)頁(yè)爬蟲
2. H5網(wǎng)頁(yè)爬蟲
3. 微信小程序爬蟲
4. 手機(jī)APP爬蟲

三、微信小程序

1. 目標(biāo)場(chǎng)景

爬取超級(jí)猩猩的課表深员,該平臺(tái)僅提供了微信小程序這一個(gè)途徑负蠕,前面兩種針對(duì)html網(wǎng)頁(yè)的爬取方式都不再適用。


2. 場(chǎng)景分析

采用抓包分析是我們制定方案的第一步倦畅。

怎么抓包遮糖?

我用的Mac電腦,fiddler只有一個(gè)簡(jiǎn)化版叠赐,所以另找了Charles這個(gè)類似的軟件欲账。啟動(dòng)Charles的代理,在手機(jī)WIFI中設(shè)置好對(duì)應(yīng)的代理就可以開抓了芭概。但是赛不,抓到的https包的內(nèi)容都是亂碼,咋辦罢洲?

怎么抓https包踢故?

Charles中提供了ssl證書,在手機(jī)端安裝證書即可惹苗。推薦使用iPhone殿较,直接安裝描述文件即可。Android手機(jī)必須使用系統(tǒng)版本在7.0以下的才行鸽粉,7.0以上還需要反編譯什么的斜脂,太麻煩了。

抓包結(jié)果

很容易的定位到了超級(jí)猩猩微信小程序載入課表的后臺(tái)接口触机。拿這個(gè)URL在瀏覽器里訪問(wèn)試試帚戳,直接返回了json結(jié)果玷或!超級(jí)猩猩很友好!



提取對(duì)應(yīng)的URL片任,放到瀏覽器中驗(yàn)證偏友,也可以支持返回json包,剩下就是分析一下這個(gè)json的數(shù)據(jù)結(jié)構(gòu)对供,按照需要的方式導(dǎo)出了位他。


3. 方案思路

  1. 使用requests庫(kù)訪問(wèn)接口地址;
  2. 解析返回的json包产场,提取數(shù)據(jù)鹅髓;(超猩返回的數(shù)據(jù)包分為課程的頭表和子表,每個(gè)字段的屬性的中文都有對(duì)應(yīng)的map表京景,需要耐心的分析一下數(shù)據(jù)包)
  3. 修改接口地址的參數(shù)窿冯,分別查詢各個(gè)城市的課表;
  4. 請(qǐng)留意這個(gè)接口采用https加密連接确徙,需處理證書的警告醒串;urllib3.disable_warnings()

4. 關(guān)鍵代碼

import requests
from requests.packages import urllib3

urllib3.disable_warnings()    # 屏蔽https的證書警告

reqURL = 'https://busi.supermonkey.com.cn/wxClass/getClassSelectList5'
cityList = ['南京市', '杭州市', '上海市', '武漢市', '北京市', '廣州市', '深圳市', '成都市']
for cityName in cityList:
    pars = {'city': cityName}
    resp = requests.get(reqURL, params=pars, verify=False)
    smdata = json.loads(resp.text)['data']
    classHeader = smdata['main']['scheduleList']  # 課程頭表
    classDetail = smdata['scheduleSmallMap']  # 課程詳情子表
    classMap = smdata['classinfoSmallMap']  # 課程參數(shù)
    coachMap = smdata['trainerSmallMap']  # 教練參數(shù)
    storeMap = smdata['boxinfoSmallMap']  # 門店參數(shù)

    # 具體json解析,請(qǐng)參考源代碼

5. 爬取結(jié)果

直接通過(guò)接口的爬取效率非常高鄙皇,幾秒鐘就拉取了全國(guó)各個(gè)門店的排課芜赌,相當(dāng)舒心。(下圖的錄屏沒(méi)有進(jìn)行加速)


腳本執(zhí)行錄屏

爬取結(jié)果

最后一個(gè)挑戰(zhàn)就是對(duì)只有Android/iOS的APP端應(yīng)用數(shù)據(jù)的爬取伴逸。請(qǐng)看下一章


四缠沈、手機(jī)APP爬蟲

請(qǐng)點(diǎn)擊:<下一頁(yè)>

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市违柏,隨后出現(xiàn)的幾起案子博烂,更是在濱河造成了極大的恐慌,老刑警劉巖漱竖,帶你破解...
    沈念sama閱讀 206,311評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件禽篱,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡馍惹,警方通過(guò)查閱死者的電腦和手機(jī)躺率,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)万矾,“玉大人悼吱,你說(shuō)我怎么就攤上這事×急罚” “怎么了后添?”我有些...
    開封第一講書人閱讀 152,671評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)薪丁。 經(jīng)常有香客問(wèn)我遇西,道長(zhǎng)馅精,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,252評(píng)論 1 279
  • 正文 為了忘掉前任粱檀,我火速辦了婚禮洲敢,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘茄蚯。我一直安慰自己压彭,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評(píng)論 5 371
  • 文/花漫 我一把揭開白布渗常。 她就那樣靜靜地躺著壮不,像睡著了一般。 火紅的嫁衣襯著肌膚如雪皱碘。 梳的紋絲不亂的頭發(fā)上忆畅,一...
    開封第一講書人閱讀 49,031評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音尸执,去河邊找鬼。 笑死缓醋,一個(gè)胖子當(dāng)著我的面吹牛如失,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播送粱,決...
    沈念sama閱讀 38,340評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼褪贵,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了抗俄?” 一聲冷哼從身側(cè)響起脆丁,我...
    開封第一講書人閱讀 36,973評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎动雹,沒(méi)想到半個(gè)月后槽卫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,466評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡胰蝠,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評(píng)論 2 323
  • 正文 我和宋清朗相戀三年歼培,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片茸塞。...
    茶點(diǎn)故事閱讀 38,039評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡躲庄,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出钾虐,到底是詐尸還是另有隱情噪窘,我是刑警寧澤,帶...
    沈念sama閱讀 33,701評(píng)論 4 323
  • 正文 年R本政府宣布效扫,位于F島的核電站倔监,受9級(jí)特大地震影響直砂,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜丐枉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評(píng)論 3 307
  • 文/蒙蒙 一哆键、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧瘦锹,春花似錦籍嘹、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至听绳,卻和暖如春颂碘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背椅挣。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工头岔, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人鼠证。 一個(gè)月前我還...
    沈念sama閱讀 45,497評(píng)論 2 354
  • 正文 我出身青樓峡竣,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親量九。 傳聞我的和親對(duì)象是個(gè)殘疾皇子适掰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 前文介紹的都是爬取web網(wǎng)頁(yè)的內(nèi)容,隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展荠列,有很多企業(yè)并沒(méi)有提web網(wǎng)頁(yè)端的服務(wù)类浪,而是開發(fā)了app來(lái)...
    逆向與爬蟲的故事閱讀 6,667評(píng)論 2 34
  • 基礎(chǔ)知識(shí) HTTP協(xié)議 我們?yōu)g覽網(wǎng)頁(yè)的瀏覽器和手機(jī)應(yīng)用客戶端與服務(wù)器通信幾乎都是基于HTTP協(xié)議,而爬蟲可以看作是...
    腩啵兔子閱讀 1,464評(píng)論 0 17
  • 01 緣起 小時(shí)候讀《三國(guó)演義》肌似,對(duì)諸葛孔明的"木牛流馬"羨慕不已费就。它不吃不喝,還特別適合在山地行走運(yùn)糧川队。上坡時(shí)受楼,...
    趙老師有話說(shuō)閱讀 738評(píng)論 0 2
  • 那一個(gè)晚上,也是差不多的深宵時(shí)分呼寸。朋友圈里看到懂生活會(huì)享受的大美女發(fā)這張圖艳汽,我沖口而出:馬卡蛋糕。大美女很快就回復(fù)...
    有書共鳴閱讀 665評(píng)論 0 0
  • 冬季的小雨帶有那一絲絲的寒意对雪,走在路上的行人急匆匆的人來(lái)人往河狐。有的帶著個(gè)保暖帶有的戴上了手套,有的穿上了厚厚的毛衣...
    書輔閱讀 173評(píng)論 0 0