requests模塊

為什么要學習requests,而不是urllib壹罚?

  • requests的底層實現(xiàn)就是urllib
  • requests在python2 和python3中通用税课,方法完全一樣
  • requests簡單易用
  • Requests能夠自動幫助我們解壓(gzip壓縮的等)網頁內容
  • 作用:發(fā)送網絡請求拨匆,返回響應數(shù)據(jù)
  • 中文文檔 API: http://docs.python-requests.org/zh_CN/latest/index.html

安裝方式

利用 pip 安裝 或者利用 easy_install 都可以完成安裝:

  • pip install requests
  • easy_install requests
  • 安裝第三方模塊
    • pip install 模塊名
    • 下載源碼解碼,進入解壓后的目錄python setup.py install
    • ***.whl 安裝方法 pip install ***.whl

基本GET請求

添加 headers 和 查詢參數(shù)

如果想添加 headers账忘,可以傳入headers參數(shù)來增加請求頭中的headers信息。如果要將參數(shù)放在url中傳遞熙宇,可以利用 params 參數(shù)鳖擒。

kw = {'wd':'長城'}  
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}  
#params 接收一個字典或者字符串的查詢參數(shù),字典類型自動轉換為url編碼烫止,不需要urlencode()  
response = requests.get("http://www.baidu.com/s?", params = kw, headers = headers)

response的常用方法:

  • response.text
  • respones.content
  • response.status_code
  • response.encoding
  • response.request.headers
  • response.headers
  • response.url

response.text 和response.content的區(qū)別

  • response.text
    類型:str
    解碼類型: 根據(jù)HTTP 頭部對響應的編碼作出有根據(jù)的推測蒋荚,推測的文本編碼
    如何修改編碼方式:response.encoding=”gbk”
  • response.content
    類型:bytes
    解碼類型: 沒有指定
    如何修改編碼方式:response.content.deocde(“utf8”)
  • 使用response.text 時,Requests 會基于 HTTP 響應的文本編碼自動解碼響應內容馆蠕,大多數(shù) Unicode 字符集都能被無縫地解碼期升。
  • 使用response.content 時,返回的是服務器響應數(shù)據(jù)的原始二進制字節(jié)流互躬,可以用來保存圖片等二進制文件播赁。
  • 更推薦使用response.content.deocde()的方式獲取響應的html頁面

為什么請求需要帶上header?

  • 模擬瀏覽器吼渡,欺騙服務器容为,獲取和瀏覽器一致的內容
    header的形式:字典
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
    用法: requests.get(url,headers=headers)

發(fā)送帶參數(shù)的請求

什么叫做請求參數(shù)
列1: http://www.webkaka.com/tutorial/server/2015/021013/
例2: https://www.baidu.com/s?wd=python&c=b
參數(shù)的形式:字典
kw = {'wd':'長城'}
用法:requests.get(url,params=kw)

基本POST請求

哪些地方我們會用到POST請求:

  • 登錄注冊( POST 比 GET 更安全)
  • 需要傳輸大文本內容的時候( POST 請求對數(shù)據(jù)長度沒有要求)
  • 所以同樣的,我們的爬蟲也需要在這兩個地方會去模擬瀏覽器發(fā)送post請求

最基本post方法

傳入data數(shù)據(jù)

對于 POST 請求來說诞吱,我們一般需要為它增加一些參數(shù)舟奠。那么最基本的傳參方法可以利用 data 這個參數(shù)

import requests
formdata = {
  "type":"AUTO",
  "i":"i love python",
  "doctype":"json",
  "xmlVersion":"1.8",
  "keyfrom":"fanyi.web",
  "ue":"UTF-8",
  "action":"FY_BY_ENTER",
  "typoResult":"true"
}
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=null"
headers={ "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"}
response = requests.post(url, data = formdata, headers = headers)
print (response.text)
# 如果是json文件可以直接顯示
print (response.json())

尋找登錄的post地址

  • 在form表單中尋找action對應的URL地址
    • post的數(shù)據(jù)是input標簽中name的值作為鍵,真正的用戶名密碼作為值的字典房维,post的URL地址就是
      action對應的URL地址

    • 抓包沼瘫,尋找登錄的url地址

      • 勾選perserve log按鈕,防止頁面跳轉找不到URL
      • 尋找post數(shù)據(jù)咙俩,確定參數(shù)
        • 參數(shù)不會變耿戚,直接用,比如密碼不是動態(tài)加密的時候
        • 參數(shù)會變
          • 參數(shù)在當前的響應中
          • 通過js生成

定位想要的js

  • 選擇會觸發(fā)js事件的按鈕阿趁,點擊event listener 找到js的位置
  • 通過chorme中的search all file來搜索url中關鍵字
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末膜蛔,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子脖阵,更是在濱河造成了極大的恐慌皂股,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件命黔,死亡現(xiàn)場離奇詭異呜呐,居然都是意外死亡就斤,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進店門蘑辑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來洋机,“玉大人,你說我怎么就攤上這事洋魂”疗欤” “怎么了?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵副砍,是天一觀的道長衔肢。 經常有香客問我,道長豁翎,這世上最難降的妖魔是什么膀懈? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮谨垃,結果婚禮上启搂,老公的妹妹穿的比我還像新娘。我一直安慰自己刘陶,他們只是感情好胳赌,可當我...
    茶點故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著匙隔,像睡著了一般疑苫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上纷责,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天捍掺,我揣著相機與錄音,去河邊找鬼再膳。 笑死挺勿,一個胖子當著我的面吹牛,可吹牛的內容都是我干的喂柒。 我是一名探鬼主播不瓶,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼灾杰!你這毒婦竟也來了蚊丐?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤艳吠,失蹤者是張志新(化名)和其女友劉穎麦备,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡凛篙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年弄屡,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鞋诗。...
    茶點故事閱讀 39,902評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖迈嘹,靈堂內的尸體忽然破棺而出削彬,到底是詐尸還是另有隱情,我是刑警寧澤秀仲,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布融痛,位于F島的核電站,受9級特大地震影響神僵,放射性物質發(fā)生泄漏雁刷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一保礼、第九天 我趴在偏房一處隱蔽的房頂上張望沛励。 院中可真熱鬧,春花似錦炮障、人聲如沸目派。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽企蹭。三九已至,卻和暖如春智末,著一層夾襖步出監(jiān)牢的瞬間谅摄,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工系馆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留送漠,地道東北人。 一個月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓由蘑,卻偏偏與公主長得像螺男,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子纵穿,可洞房花燭夜當晚...
    茶點故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內容