requests模塊

為什么要學習`requests`，而不是`urllib`壹罚？

requests的底層實現(xiàn)就是urllib
requests在python2 和python3中通用税课，方法完全一樣
requests簡單易用
Requests能夠自動幫助我們解壓(gzip壓縮的等)網頁內容
作用：發(fā)送網絡請求拨匆，返回響應數(shù)據(jù)
中文文檔 API： http://docs.python-requests.org/zh_CN/latest/index.html

安裝方式

利用 pip 安裝或者利用 easy_install 都可以完成安裝：

pip install requests
easy_install requests
安裝第三方模塊
- pip install 模塊名
- 下載源碼解碼，進入解壓后的目錄python setup.py install
- ***.whl 安裝方法 pip install ***.whl

基本GET請求

response = requests.get("http://www.baidu.com/")
也可以這么寫
response = requests.request("get", "http://www.baidu.com/")

添加 headers 和查詢參數(shù)

如果想添加 headers账忘，可以傳入headers參數(shù)來增加請求頭中的headers信息。如果要將參數(shù)放在url中傳遞熙宇，可以利用 params 參數(shù)鳖擒。

kw = {'wd':'長城'}  
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}  
#params 接收一個字典或者字符串的查詢參數(shù)，字典類型自動轉換為url編碼烫止，不需要urlencode()  
response = requests.get("http://www.baidu.com/s?", params = kw, headers = headers)

response的常用方法：

response.text
respones.content
response.status_code
response.encoding
response.request.headers
response.headers
response.url

response.text 和response.content的區(qū)別

response.text
類型：str
解碼類型：根據(jù)HTTP 頭部對響應的編碼作出有根據(jù)的推測蒋荚，推測的文本編碼
如何修改編碼方式：response.encoding=”gbk”
response.content
類型：bytes
解碼類型：沒有指定
如何修改編碼方式：response.content.deocde(“utf8”)
使用response.text 時，Requests 會基于 HTTP 響應的文本編碼自動解碼響應內容馆蠕，大多數(shù) Unicode 字符集都能被無縫地解碼期升。
使用response.content 時，返回的是服務器響應數(shù)據(jù)的原始二進制字節(jié)流互躬，可以用來保存圖片等二進制文件播赁。
更推薦使用response.content.deocde()的方式獲取響應的html頁面

為什么請求需要帶上header？

模擬瀏覽器吼渡，欺騙服務器容为，獲取和瀏覽器一致的內容
header的形式：字典
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
用法： requests.get(url,headers=headers)

發(fā)送帶參數(shù)的請求

什么叫做請求參數(shù)
列1: http://www.webkaka.com/tutorial/server/2015/021013/
例2： https://www.baidu.com/s?wd=python&c=b
參數(shù)的形式：字典
kw = {'wd':'長城'}
用法：requests.get(url,params=kw)

基本POST請求

哪些地方我們會用到POST請求：

登錄注冊（ POST 比 GET 更安全）
需要傳輸大文本內容的時候（ POST 請求對數(shù)據(jù)長度沒有要求）
所以同樣的，我們的爬蟲也需要在這兩個地方會去模擬瀏覽器發(fā)送post請求

最基本post方法

response = requests.post("http://www.baidu.com/", data = data)

傳入data數(shù)據(jù)

對于 POST 請求來說诞吱，我們一般需要為它增加一些參數(shù)舟奠。那么最基本的傳參方法可以利用 data 這個參數(shù)

import requests
formdata = {
  "type":"AUTO",
  "i":"i love python",
  "doctype":"json",
  "xmlVersion":"1.8",
  "keyfrom":"fanyi.web",
  "ue":"UTF-8",
  "action":"FY_BY_ENTER",
  "typoResult":"true"
}
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=null"
headers={ "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"}
response = requests.post(url, data = formdata, headers = headers)
print (response.text)
# 如果是json文件可以直接顯示
print (response.json())

尋找登錄的post地址

在form表單中尋找action對應的URL地址
- post的數(shù)據(jù)是input標簽中name的值作為鍵，真正的用戶名密碼作為值的字典房维，post的URL地址就是
  action對應的URL地址
- 抓包沼瘫，尋找登錄的url地址
  - 勾選perserve log按鈕，防止頁面跳轉找不到URL
  - 尋找post數(shù)據(jù)咙俩，確定參數(shù)
    - 參數(shù)不會變耿戚，直接用，比如密碼不是動態(tài)加密的時候
    - 參數(shù)會變
      - 參數(shù)在當前的響應中
      - 通過js生成

定位想要的js

選擇會觸發(fā)js事件的按鈕阿趁，點擊event listener 找到js的位置
通過chorme中的search all file來搜索url中關鍵字

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末膜蛔，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子脖阵，更是在濱河造成了極大的恐慌皂股，老刑警劉巖，帶你破解...
沈念sama閱讀 217,657評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件命黔，死亡現(xiàn)場離奇詭異呜呐，居然都是意外死亡就斤，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,889評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門蘑辑，熙熙樓的掌柜王于貴愁眉苦臉地迎上來洋机，“玉大人，你說我怎么就攤上這事洋魂”疗欤” “怎么了？”我有些...
開封第一講書人閱讀 164,057評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵副砍，是天一觀的道長衔肢。經常有香客問我，道長豁翎，這世上最難降的妖魔是什么膀懈？我笑而不...
開封第一講書人閱讀 58,509評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮谨垃，結果婚禮上启搂，老公的妹妹穿的比我還像新娘。我一直安慰自己刘陶，他們只是感情好胳赌，可當我...
茶點故事閱讀 67,562評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著匙隔，像睡著了一般疑苫。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上纷责，一...
開封第一講書人閱讀 51,443評論 1贊 302
城市分裂傳說
那天捍掺，我揣著相機與錄音，去河邊找鬼再膳。笑死挺勿，一個胖子當著我的面吹牛，可吹牛的內容都是我干的喂柒。我是一名探鬼主播不瓶，決...
沈念sama閱讀 40,251評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼灾杰！你這毒婦竟也來了蚊丐？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,129評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤艳吠，失蹤者是張志新（化名）和其女友劉穎麦备，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經...
沈念sama閱讀 45,561評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡凛篙，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,779評論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年弄屡，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鞋诗。...
茶點故事閱讀 39,902評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖迈嘹，靈堂內的尸體忽然破棺而出削彬，到底是詐尸還是另有隱情，我是刑警寧澤秀仲，帶...
沈念sama閱讀 35,621評論 5贊 345
?日本核電站爆炸內幕
正文年R本政府宣布融痛，位于F島的核電站，受9級特大地震影響神僵，放射性物質發(fā)生泄漏雁刷。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,220評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一保礼、第九天我趴在偏房一處隱蔽的房頂上張望沛励。院中可真熱鬧，春花似錦炮障、人聲如沸目派。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,838評論 0贊 22
一樁弒父案胁赢，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽企蹭。三九已至，卻和暖如春智末，著一層夾襖步出監(jiān)牢的瞬間谅摄，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,971評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工系馆，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留送漠，地道東北人。一個月前我還...
沈念sama閱讀 48,025評論 2贊 370
代替公主和親
正文我出身青樓由蘑，卻偏偏與公主長得像螺男，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子纵穿，可洞房花燭夜當晚...
茶點故事閱讀 44,843評論 2贊 354