這是自己學(xué)習(xí)Python以來(lái)幸缕,第一次實(shí)戰(zhàn)編寫(xiě)的一個(gè)小功能极舔。
循序漸進(jìn)凤覆,分三個(gè)階段。
第一階段拆魏,只是單純的獲取貼吧某頁(yè)面的圖片鏈接
import requestsfrom bs4
import BeautifulSoup
url='http://tieba.baidu.com/p/3990192462'
wb_data=requests.get(url)
soup=BeautifulSoup(wb_data.text,'lxml')#獲取這個(gè)帖子下,正文中圖片鏈接盯桦。
links=soup.select('img.BDE_Image')for link in links:
clink=link.get('src')
print(clink)
第二階段,我添加了下載該頁(yè)面圖片到本地電腦的功能渤刃。
import requests,urllib.requestfrom bs4
import BeautifulSoup
url='http://tieba.baidu.com/p/3990192462'
path='/Users/pro/Desktop/picture/'
# picture 后面是否加上"/",就會(huì)得到不一樣的下載結(jié)果,細(xì)節(jié)很關(guān)鍵拥峦。
wb_data=requests.get(url)
soup=BeautifulSoup(wb_data.text,'lxml')
#獲取這個(gè)帖子下,正文中圖片鏈接。
links=soup.select('img.BDE_Image')
for link in links:
clink=link.get('src')
print(clink)
#下載圖片
urllib.request.urlretrieve(clink,path+clink[-10:])
print("Done")
'''Python中,mac系統(tǒng)下,如何查看文件的絕對(duì)路徑?答:打開(kāi)mac終端,復(fù)制文件粘貼進(jìn)去,就能得到該文件的絕對(duì)路徑卖子。其次,注意,mac系統(tǒng)下的文件路徑都是 英文!'''
第三階段略号,我又添加了新功能。這個(gè)帖子洋闽,一共4頁(yè)玄柠。我要實(shí)現(xiàn)一鍵下載4頁(yè)中的圖片到我的本地電腦中。
import requests,urllib.request,time
from bs4 import BeautifulSoup
url='http://tieba.baidu.com/p/3990192462?pn=1' #這是起始頁(yè),一共4頁(yè)诫舅。
path='/Users/pro/Desktop/picture/' # picture 后面是否加上"/",就會(huì)得到一樣的下載結(jié)果,細(xì)節(jié)很關(guān)鍵羽利。
def download_pic_from(url):
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text, 'lxml')
# 獲取這個(gè)帖子下,正文中圖片鏈接。
links = soup.select('img.BDE_Image')
for link in links:
clink = link.get('src')
print(clink)
# 下載圖片
urllib.request.urlretrieve(clink, path + clink[-10:])
print("Done")
def get_more_pages(start,end):
for one in range(start,end):
url2="http://tieba.baidu.com/p/3990192462?pn={}".format(one)
download_pic_from(url2)
time.sleep(2)
get_more_pages(1,8)
能實(shí)現(xiàn)這樣的功能刊懈,說(shuō)明我進(jìn)步了这弧,不過(guò),該實(shí)例也只能說(shuō)明一點(diǎn)點(diǎn)小進(jìn)步而已虚汛,功能過(guò)于簡(jiǎn)單匾浪,我相信Python有著更為強(qiáng)大的功能等待著我去開(kāi)發(fā)和學(xué)習(xí)。
最終應(yīng)用>砹ā5氨病!