'''這是打開了一個(gè)有關(guān)碧玉盆栽的介紹的網(wǎng)站,里面的圖片分為碧玉圖片和廣告圖片吩屹,根據(jù)性質(zhì)的不同,
將他們下載下來钻蔑,自動(dòng)保存到兩個(gè)不同的文件夾里'''
from urllib.request import urlopen
from urllib.request import urlretrieve
from bs4 import BeautifulSoup
import re
import os
html=urlopen("http://www.pchouse.com.cn/baike/shenghuo/2745/")
bsObj=BeautifulSoup(html,"html.parser")
#獲取網(wǎng)站中所有碧玉的圖片
Biyus=bsObj.findAll("p",{"style":re.compile("^text-align")})
for i,x in enumerate(Biyus):
? ? ?print(x.find("img").attrs["src"])
? ? ?directory=os.path.dirname("/D:/image/mqq"+str[i]+".jpg")
? ? ?if not os.path.exists(directory):
? ? ? ? ? ? os.makedirs(directory)
? ? urlretrieve(x.find("img").attrs["src"],directory)
#獲取所有廣告類圖片
Ads=bsObj.findAll("img",{"width":{"120","310"}})
for i,ad in enumerate(Ads):
? ? ?print(ad.attrs["src"])
? ? directory=os.path.dirname("Ads/mqq"+str([i])+".jpg")
? ? if not os.path.exists(directory):
? ? ? ? ?os.makedirs(directory)
? ? ? ? ?urlretrieve(ad.attrs["src"],directory)