一舟奠、學(xué)習(xí)目標(biāo)
1.簡(jiǎn)單學(xué)會(huì)下載一個(gè)網(wǎng)頁(yè)。
2.學(xué)會(huì)使用urllib模塊中的urllib.request模塊房维。
3.簡(jiǎn)單理解爬取網(wǎng)頁(yè)的過(guò)程沼瘫。
二、代碼實(shí)現(xiàn)與簡(jiǎn)單說(shuō)明
importurllib.request ##導(dǎo)入request模塊
url_name="http://www.0510kg.com"##定義一個(gè)變量握巢,用來(lái)存儲(chǔ)需要下載的網(wǎng)址
file_text=urllib.request.urlopen(url_name)##使用urllib.request.urlopen()方法晕鹊,打開網(wǎng)頁(yè)
html_text=file_text.readlines()##使用readlines()方法松却,讀取網(wǎng)頁(yè)代碼暴浦,readlines讀取的是網(wǎng)頁(yè)的全部?jī)?nèi)容,返回一個(gè)列表變量
with open("1.html",'wb')as f:##將讀取結(jié)果存儲(chǔ)在程序當(dāng)前目錄的1.html文件中
f.writelines(html_text)##寫入讀取內(nèi)容到文件
三晓锻、查看根目錄歌焦,有1.html存在,打開文件可看見(jiàn)如下: