urllib用法

1.urllib.parse.urlencode()方法:

一般HTTP請求提交數(shù)據(jù)鸳惯,需要編碼成 URL編碼格式,然后做為url的一部分,或者作為參數(shù)傳到Request對象中.
這時可以使用urllib.parse模塊下的urlencode()函數(shù),幫我們將key:value這樣的鍵值對轉(zhuǎn)換"key=value"這樣的字符串职员,解碼工作可以使用urllib.parse的unquote()函數(shù)蹄咖。

例如獲取百度美女貼吧的url
import urllib.parse

url = "http://tieba.baidu.com/f?"
key = urllib.parse.urlencode({"kw" : "美女"})
url = url + key
組合后的url示例:http://tieba.baidu.com/f?kw=%E7%BE%8E%E5%A5%B3

2.urllib.request()

快速爬取一個網(wǎng)頁

import urllib.request
url = 'http://www.baidu.com/'
response = urllib.request.urlopen(url)
html = response.read()
with open('baidu/baidu.html','w') as f:
f.write(html.decode())
f.close()

3.urllib高級用法一,自定義opener

基本的urlopen()方法不支持代理巧婶、cookie等其他的HTTP/HTTPS高級功能

簡單的自定義opener()

import urllib.request
url = 'http://www.baidu.com'
https_handler = urllib.request.HTTPHandler()
opener = urllib.request.build_opener(https_handler)
request = urllib.request.Request(url=url)
response = opener.open(request)
content = response.read().decode()
with open('baidu.html','w') as f:
f.write(content)

4.urllib高級用法二,設(shè)置代理

基本原理: 代理實際上指的就是代理服務(wù)器贪染,英文叫作proxy server越走,它的功能是代理網(wǎng)絡(luò)用戶去取得網(wǎng)絡(luò)信息棚品。形象地說,它是網(wǎng)絡(luò)信息的中轉(zhuǎn)站廊敌。在我們正常請求一個網(wǎng)站時铜跑,其實是發(fā)送了請求給Web服務(wù)器,Web服務(wù)器把響應(yīng)傳回給我們骡澈。如果設(shè)置了代理服務(wù)器锅纺,實際上就是在本機和服務(wù)器之間搭建了一個橋,此時本機不是直接向Web服務(wù)器發(fā)起請求肋殴,而是向代理服務(wù)器發(fā)出請求囤锉,請求會發(fā)送給代理服務(wù)器,然后由代理服務(wù)器再發(fā)送給Web服務(wù)器护锤,接著由代理服務(wù)器再把Web服務(wù)器返回的響應(yīng)轉(zhuǎn)發(fā)給本機官地。這樣我們同樣可以正常訪問網(wǎng)頁,但這個過程中Web服務(wù)器識別出的真實IP就不再是我們本機的IP了烙懦,就成功實現(xiàn)了IP偽裝驱入,這就是代理的基本原理

import urllib.request
import urllib.parse

西刺免費代理IP:http://www.xicidaili.com/

快代理免費代理:https://www.kuaidaili.com/free/inha/

proxy = {
'http':'61.176.223.7:58822',
'https':'180.121.135.91:3128'
}
url = 'http://www.baidu.com'

創(chuàng)建處理代理的handler

proxyhandler = urllib.request.ProxyHandler(
proxies=proxy
)

創(chuàng)建一個opener

opener = urllib.request.build_opener(proxyhandler)

構(gòu)造一個請求

request = urllib.request.Request(url=url)
response = opener.open(request)
content = response.read().decode()
with open('daili.html','w') as f:
f.write(content)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市氯析,隨后出現(xiàn)的幾起案子亏较,更是在濱河造成了極大的恐慌,老刑警劉巖掩缓,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件雪情,死亡現(xiàn)場離奇詭異,居然都是意外死亡拾因,警方通過查閱死者的電腦和手機旺罢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門旷余,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人扁达,你說我怎么就攤上這事正卧。” “怎么了跪解?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵炉旷,是天一觀的道長。 經(jīng)常有香客問我叉讥,道長窘行,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任图仓,我火速辦了婚禮罐盔,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘救崔。我一直安慰自己惶看,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布六孵。 她就那樣靜靜地躺著纬黎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪劫窒。 梳的紋絲不亂的頭發(fā)上本今,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機與錄音主巍,去河邊找鬼冠息。 笑死,一個胖子當(dāng)著我的面吹牛煤禽,可吹牛的內(nèi)容都是我干的铐达。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼檬果,長吁一口氣:“原來是場噩夢啊……” “哼瓮孙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起选脊,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤杭抠,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后恳啥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體偏灿,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年钝的,在試婚紗的時候發(fā)現(xiàn)自己被綠了翁垂。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片铆遭。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖沿猜,靈堂內(nèi)的尸體忽然破棺而出枚荣,到底是詐尸還是另有隱情,我是刑警寧澤啼肩,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布橄妆,位于F島的核電站,受9級特大地震影響祈坠,放射性物質(zhì)發(fā)生泄漏害碾。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一赦拘、第九天 我趴在偏房一處隱蔽的房頂上張望慌随。 院中可真熱鬧,春花似錦另绩、人聲如沸儒陨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至椭员,卻和暖如春车海,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背隘击。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工侍芝, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人埋同。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓州叠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親凶赁。 傳聞我的和親對象是個殘疾皇子咧栗,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345