python實戰(zhàn)計劃第一周作業(yè):1.2解析網(wǎng)頁

實現(xiàn)了用python代碼讀取本地網(wǎng)頁的并解析出其中的內(nèi)容

需要解析的網(wǎng)頁

實現(xiàn)代碼

from bs4 import BeautifulSoup

info = []
starslist = []
with open('/Users/Trudy/Desktop/plan-for-combating/week1/1_2/1_2answer_of_homework/index.html', 'r') as wb_data:
    soup = BeautifulSoup(wb_data, 'lxml')
    images = soup.select(
        "body > div > div > div.col-md-9 > div > div > div > img")
    prices = soup.select(
        "body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right")
    titles = soup.select(
        "body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a")
    stars = soup.select(
        "body > div > div > div.col-md-9 > div > div > div > div.ratings > p:nth-of-type(2)")
    reviews = soup.select(
        "body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right")

for image,price,title,star,review in zip(images,prices,titles,stars,reviews):
    data={
        'image':image.get_text(),
        'price':price.get_text(),
        'title':title.get_text(),
        'star':len(star.find_all("span","glyphicon glyphicon-star")),
        'review':review.get_text()
    }
    info.append(data)

for i in info:
    print(i['title'],i['price'],i['image'],i['review'],i['star'])

總結(jié):

  • nth-of-type(2)父元素的第二個 p 元素的每個 p
  • find_all() 方法搜索當前tag的所有tag子節(jié)點,并判斷是否符合過濾器的條件.這里有幾個例子:
soup.find_all("title")
#[<title>The Dormouse's story</title>]
soup.find_all("p", "title"
[<p class="title"><b>The Dormouse's story</b></p>]
soup.find_all("a")
#[<a class="sister"  id="link1">Elsie</a>,
#<a class="sister"  id="link2">Lacie</a>,
#<a class="sister"  id="link3">Tillie</a>]
soup.find_all(id="link2")
#[<a class="sister"  id="link2">Lacie</a>]
import re
soup.find(string=re.compile("sisters"))
# u'Once upon a time there were three little sisters; and their names were\n'
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末雕沿,一起剝皮案震驚了整個濱河市夺谁,隨后出現(xiàn)的幾起案子寒屯,更是在濱河造成了極大的恐慌吱抚,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,036評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件他嫡,死亡現(xiàn)場離奇詭異昔逗,居然都是意外死亡出皇,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評論 3 395
  • 文/潘曉璐 我一進店門堂竟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來魂毁,“玉大人,你說我怎么就攤上這事出嘹∠” “怎么了?”我有些...
    開封第一講書人閱讀 164,411評論 0 354
  • 文/不壞的土叔 我叫張陵税稼,是天一觀的道長烦秩。 經(jīng)常有香客問我,道長郎仆,這世上最難降的妖魔是什么闻镶? 我笑而不...
    開封第一講書人閱讀 58,622評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮丸升,結(jié)果婚禮上铆农,老公的妹妹穿的比我還像新娘。我一直安慰自己狡耻,他們只是感情好墩剖,可當我...
    茶點故事閱讀 67,661評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著夷狰,像睡著了一般岭皂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上沼头,一...
    開封第一講書人閱讀 51,521評論 1 304
  • 那天爷绘,我揣著相機與錄音,去河邊找鬼进倍。 笑死土至,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的猾昆。 我是一名探鬼主播陶因,決...
    沈念sama閱讀 40,288評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼垂蜗!你這毒婦竟也來了楷扬?” 一聲冷哼從身側(cè)響起解幽,我...
    開封第一講書人閱讀 39,200評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎烘苹,沒想到半個月后躲株,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,644評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡镣衡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,837評論 3 336
  • 正文 我和宋清朗相戀三年徘溢,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片捆探。...
    茶點故事閱讀 39,953評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡然爆,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出黍图,到底是詐尸還是另有隱情曾雕,我是刑警寧澤,帶...
    沈念sama閱讀 35,673評論 5 346
  • 正文 年R本政府宣布助被,位于F島的核電站剖张,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏揩环。R本人自食惡果不足惜搔弄,卻給世界環(huán)境...
    茶點故事閱讀 41,281評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望丰滑。 院中可真熱鬧顾犹,春花似錦、人聲如沸褒墨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽郁妈。三九已至浑玛,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間噩咪,已是汗流浹背顾彰。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留胃碾,地道東北人涨享。 一個月前我還...
    沈念sama閱讀 48,119評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像书在,于是被迫代替她去往敵國和親灰伟。 傳聞我的和親對象是個殘疾皇子拆又,可洞房花燭夜當晚...
    茶點故事閱讀 44,901評論 2 355

推薦閱讀更多精彩內(nèi)容