Date | Tags |
---|---|
2019/10/14 | Python丧枪, Gerrit Code Review |
引入
因?yàn)轫?xiàng)目的需求光涂,需要抓取面板上的相關(guān)信息, 但是有時(shí)候右鍵打開(kāi)查看網(wǎng)頁(yè)源碼
的時(shí)候只能看到一些HTML和JS數(shù)據(jù)拧烦,相關(guān)的信息完全找不到忘闻。
內(nèi)容
折騰蠻久的, 才發(fā)現(xiàn)需要的信息根本不在這個(gè)網(wǎng)頁(yè)上恋博。那怎么查看到相關(guān)的消息呢齐佳。
- 在谷歌網(wǎng)頁(yè)上
F12
打開(kāi)調(diào)式模式 - 找到Network-> All中一一尋找葵蒂, 如下圖
- Headers中可以找到相應(yīng)的請(qǐng)求信息, 如請(qǐng)求
url
- Response可以找到相應(yīng)的響應(yīng)重虑,即我們需要找的相關(guān)的信息
- Preview可以結(jié)構(gòu)化的查看Response
腳本化
- 模擬登入
- 模擬請(qǐng)求
- 分析請(qǐng)求結(jié)果
import requests
REQUEST = requests.session()
LOGIN_URL = 'https://www.XXX.com/'
FORM_DATA = {'name': 'XXX',
'password': 'XXX',
'remember': 'XXX'}
# 模擬登入践付, 其中參數(shù)name, password, remember 可能因?yàn)槊總€(gè)網(wǎng)頁(yè)登入?yún)?shù)不同而不同
REQUEST.post(LOGIN_URL, data=FORM_DATA, timeout=60)
# 模擬請(qǐng)求, REQUEST_URL即上述圖片中的 Request URL
r = REQUEST.get(REQUEST_URL)
# 打印響應(yīng)
print r.content