week1-2作業(yè):
學(xué)習(xí)python的第一周 5.16號爬取了本地的靜態(tài)頁面
主要抓取上圖中商品的 標(biāo)題函喉,價格函似,評分喉童,星級,圖片地址等信息 抓取代碼如下
frombs4importBeautifulSoup
withopen('C:/Users/rjkf/Desktop/python/Plan-for-combating-master/week1/1_2/1_2answer_of_homework/1_2_homework_required/index.html','r')aswb_data:
Soup=BeautifulSoup(wb_data,'lxml')
titles=Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')# 復(fù)制每個元素的css selector 路徑即可
images=Soup.select('body > div > div > div.col-md-9 > div > div > div > img')
gradeNums=Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')
prices=Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')
stars=Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p:nth-of-type(2)')
fortitle,price,gradeNum,image,starinzip(titles,prices,gradeNums,images,stars):
data={
'標(biāo)題':title.get_text(),
'價格':price.get_text(),
'圖片路徑':image.get('src'),
'評分量':gradeNum.get_text(),
'星級':len(star.find_all("span",class_='glyphicon glyphicon-star'))
}
print(data)
運(yùn)行結(jié)果為:
總結(jié):
-.通過week1-2的練習(xí) 初步掌握了BeautifulSoup的基礎(chǔ)運(yùn)用
-.了解了with open的用法
-. 初步掌握了元組的用法