打卡:1-2爬取自己網(wǎng)頁(yè)的信息

要爬取的信息來(lái)源

爬取的信息的成果展示

image : img/pic_0000_073a9256d9624c92a05dc680fc28865f.jpg
price : $24.99
view : 65 reviews
describe : See more snippets like this online store item at web store 
score : 5
title : EarPod


image : img/pic_0005_828148335519990171_c234285520ff.jpg
price : $64.99
view : 12 reviews
describe : This is a short description. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
score : 4
title : New Pocket


image : img/pic_0006_949802399717918904_339a16e02268.jpg
price : $74.99
view : 31 reviews
describe : This is a short description. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
score : 4
title : New sunglasses


image : img/pic_0008_975641865984412951_ade7a767cfc8.jpg
price : $84.99
view : 6 reviews
describe : This is a short description. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
score : 3
title : Art Cup


image : img/pic_0001_160243060888837960_1c3bcd26f5fe.jpg
price : $94.99
view : 18 reviews
describe : This is a short description. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
score : 4
title : iphone gamepad


image : img/pic_0002_556261037783915561_bf22b24b9e4e.jpg
price : $214.5
view : 18 reviews
describe : This is a short description. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
score : 4
title : Best Bed


image : img/pic_0011_1032030741401174813_4e43d182fce7.jpg
price : $500
view : 35 reviews
describe : This is a short description. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
score : 4
title : iWatch


image : img/pic_0010_1027323963916688311_09cc2d7648d9.jpg
price : $15.5
view : 8 reviews
describe : This is a short description. Lorem ipsum dolor sit amet, consectetur adipiscing elit.
score : 4
title : Park tickets

源代碼

from bs4 import BeautifulSoupwith open('./index.html', 'r') as wbdata:
    soup = BeautifulSoup(wbdata, 'lxml')
    images = soup.select('div > div.col-md-9 > div > div > div > img')
    titles = soup.select('div.caption > h4:nth-of-type(2) > a')
    prices = soup.select('div.caption > h4.pull-right')
    describes = soup.select('div.caption > p')
    views = soup.select(' div.ratings > p.pull-right')
    scores = soup.select('div > div.ratings > p:nth-of-type(2)')

info = []
for title, image, price, describe, view, score in zip(titles, images, prices, describes, views, scores): 
   data = {
        'title': title.get_text(),
        'image': image.get('src'),
        'price': price.get_text(),
        'describe': describe.get_text(),
        'view': view.get_text(),
        'score': len(score.find_all('span','glyphicon glyphicon-star'))
    }
    info.append(data)

for i in info:
    for a in i:
        print(a, ':', i[a])
    print('\n')

筆記

1路媚、Beautiful Soup不支持Nth-child語(yǔ)法凌盯,所以要換成nth-of type(或者去掉這個(gè)部分案啦)
2、soup.select()盡量不用完整selector
3集嵌、要學(xué)著自己看錯(cuò)題集和文檔
4讥电、耐心看debug提示信息
5、獲得某一標(biāo)簽下的屬性可以用get()也可以用find_all()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末猜年,一起剝皮案震驚了整個(gè)濱河市抡锈,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌乔外,老刑警劉巖床三,帶你破解...
    沈念sama閱讀 210,914評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異杨幼,居然都是意外死亡撇簿,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評(píng)論 2 383
  • 文/潘曉璐 我一進(jìn)店門差购,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)四瘫,“玉大人,你說(shuō)我怎么就攤上這事欲逃≌颐郏” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,531評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵暖夭,是天一觀的道長(zhǎng)锹杈。 經(jīng)常有香客問(wèn)我,道長(zhǎng)迈着,這世上最難降的妖魔是什么竭望? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,309評(píng)論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮裕菠,結(jié)果婚禮上咬清,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好旧烧,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,381評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布影钉。 她就那樣靜靜地躺著,像睡著了一般掘剪。 火紅的嫁衣襯著肌膚如雪平委。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,730評(píng)論 1 289
  • 那天夺谁,我揣著相機(jī)與錄音廉赔,去河邊找鬼。 笑死匾鸥,一個(gè)胖子當(dāng)著我的面吹牛蜡塌,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播勿负,決...
    沈念sama閱讀 38,882評(píng)論 3 404
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼馏艾,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了奴愉?” 一聲冷哼從身側(cè)響起琅摩,我...
    開(kāi)封第一講書(shū)人閱讀 37,643評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎躁劣,沒(méi)想到半個(gè)月后迫吐,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體库菲,經(jīng)...
    沈念sama閱讀 44,095評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡账忘,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,448評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了熙宇。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鳖擒。...
    茶點(diǎn)故事閱讀 38,566評(píng)論 1 339
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖烫止,靈堂內(nèi)的尸體忽然破棺而出蒋荚,到底是詐尸還是另有隱情,我是刑警寧澤馆蠕,帶...
    沈念sama閱讀 34,253評(píng)論 4 328
  • 正文 年R本政府宣布期升,位于F島的核電站,受9級(jí)特大地震影響互躬,放射性物質(zhì)發(fā)生泄漏播赁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,829評(píng)論 3 312
  • 文/蒙蒙 一吼渡、第九天 我趴在偏房一處隱蔽的房頂上張望容为。 院中可真熱鬧,春花似錦、人聲如沸坎背。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,715評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)得滤。三九已至陨献,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間懂更,已是汗流浹背湿故。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,945評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留膜蛔,地道東北人坛猪。 一個(gè)月前我還...
    沈念sama閱讀 46,248評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像皂股,于是被迫代替她去往敵國(guó)和親墅茉。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,440評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容