python爬蟲之urllib_get

1.使用urllib發(fā)起請(qǐng)求

from urllib import request
import ssl

2.目標(biāo)url

url = 'http://www.baidu.com/'

3.request.urlopen():使用urlopen方法模擬瀏覽器發(fā)起請(qǐng)求

"""
url, 請(qǐng)求的目標(biāo)url地址
data=None,默認(rèn)情況為None,表示發(fā)起的是一個(gè)get請(qǐng)求,不為None,則發(fā)起的是一個(gè)post請(qǐng)求
timeout=,設(shè)置請(qǐng)求的超時(shí)時(shí)間 
cafile=None, 設(shè)置證書
capath=None, 設(shè)置證書路徑
cadefault=False, 是否要使用默認(rèn)證書(默認(rèn)為False)
context=None:是一個(gè)ssl值,表示忽略ssl認(rèn)證
"""

4.是一個(gè)ssl值,表示忽略ssl認(rèn)證(如果請(qǐng)求出現(xiàn)了ssl證書認(rèn)證錯(cuò)誤,

5.我們就需要設(shè)置ssl._create_unverified_context(),忽略證書認(rèn)證)

content = ssl._create_unverified_context()
response = request.urlopen(url,timeout=10,content=content)

6.從response響應(yīng)結(jié)果中獲取參數(shù)

7.狀態(tài)碼

code = response.status
print(code)

8.獲取頁面源碼的二進(jìn)制數(shù)據(jù)

b_html = response.read()
print(type(b_html),len(b_html))

9.獲取響應(yīng)的響應(yīng)頭部(Response Headers)

res_headers = response.getheaders()
print(res_headers)

10.獲取響應(yīng)頭中指定參數(shù)的值

cookie_data = response.getheader('Set-Cookie')
print(cookie_data)

11.reason返回一個(gè)響應(yīng)結(jié)果的原因

reason = response.reason
print(reason)

12.將獲取到的二進(jìn)制數(shù)據(jù),轉(zhuǎn)換為字符串decode

str_html = b_html.decode('utf-8')
print(type(str_html))

with open('b_baidu.page.html','w') as file:
# file.write(b_html)
file.write(str_html)

13.如果請(qǐng)求要攜帶請(qǐng)求頭

14.需要先構(gòu)建一個(gè)request對(duì)象

"""
url:發(fā)起請(qǐng)求的url地址
data=None, 默認(rèn)情況為None,表示發(fā)起的是一個(gè)get請(qǐng)求,不為None,則發(fā)起的是一個(gè)post請(qǐng)求
headers={},設(shè)置請(qǐng)求頭(headers對(duì)應(yīng)的數(shù)據(jù)類型是一個(gè)字典)
origin_req_host=None, (指定發(fā)起請(qǐng)求的域)
unverifiable=False,忽略SSL認(rèn)證
method=None:指定發(fā)起請(qǐng)求的方式
"""
req_header = {
'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}
req = request.Request(url,headers=req_header)

15.根據(jù)構(gòu)建的req請(qǐng)求對(duì)象發(fā)起請(qǐng)求

response = request.urlopen(req)
response.status
response.read()
response.getheaders()
response.getheader('Server')
response.reason

16.str和bytes數(shù)據(jù)類型

python2中:對(duì)于字符串和bytes類型的數(shù)據(jù)沒有明顯的區(qū)分

python3中:對(duì)于字符串和bytes類型的數(shù)據(jù)有明顯的區(qū)分
將bytes類型的數(shù)據(jù)轉(zhuǎn)換為字符串使用decode('編碼類型')
將字符串轉(zhuǎn)換為bytes類型的數(shù)據(jù)使用encode('編碼類型')
bytearray和bytes類型的數(shù)據(jù)是有區(qū)別的:前者是可變的,后者是不可變的

17.常見的字符集的編碼類型: utf-8 gbk gb2312

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市碳抄,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嘹狞,死亡現(xiàn)場(chǎng)離奇詭異毒坛,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)秫逝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來询枚,“玉大人违帆,你說我怎么就攤上這事〗鹗瘢” “怎么了刷后?”我有些...
    開封第一講書人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長渊抄。 經(jīng)常有香客問我尝胆,道長,這世上最難降的妖魔是什么护桦? 我笑而不...
    開封第一講書人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任含衔,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘贪染。我一直安慰自己缓呛,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開白布杭隙。 她就那樣靜靜地躺著哟绊,像睡著了一般。 火紅的嫁衣襯著肌膚如雪痰憎。 梳的紋絲不亂的頭發(fā)上票髓,一...
    開封第一講書人閱讀 51,598評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音铣耘,去河邊找鬼炬称。 笑死,一個(gè)胖子當(dāng)著我的面吹牛涡拘,可吹牛的內(nèi)容都是我干的玲躯。 我是一名探鬼主播,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼鳄乏,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼跷车!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起橱野,我...
    開封第一講書人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤朽缴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后水援,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體密强,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年蜗元,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了或渤。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡奕扣,死狀恐怖薪鹦,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情惯豆,我是刑警寧澤池磁,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站楷兽,受9級(jí)特大地震影響地熄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜芯杀,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一端考、第九天 我趴在偏房一處隱蔽的房頂上張望银舱。 院中可真熱鬧,春花似錦跛梗、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至顽染,卻和暖如春漾岳,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背粉寞。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來泰國打工尼荆, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人唧垦。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓捅儒,卻偏偏與公主長得像,于是被迫代替她去往敵國和親振亮。 傳聞我的和親對(duì)象是個(gè)殘疾皇子巧还,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容