BeautifulSoup 爬取網(wǎng)絡(luò)數(shù)據(jù)(3)-處理子節(jié)點(diǎn)(children)和其他子孫節(jié)點(diǎn)(descendants)

3. 1子節(jié)點(diǎn)和子孫節(jié)點(diǎn)

soup.body.h1# 選中body 標(biāo)簽下的h1沪羔，這個(gè)h1 標(biāo)簽是body標(biāo)簽的子節(jié)點(diǎn)

同理苟鸯，soup.div.find_all('img')會(huì)找到所有div里面的img標(biāo)簽。
.children 和.descendants
對(duì)比代碼如下：

html = urlopen('http://www.pythonscraping.com/pages/page3.html')
soup = BeautifulSoup(html, 'lxml')
children = soup.find('table',{'id':'giftList'}).children
descendants = soup.find('table',{'id':'giftList'}).descendants
sum = 0
for child in children:
    print(child)
    sum +=1
print(sum)
sum2 = 0
for descendant in descendants:
    sum2+=1
    print(descendant)
print(sum2)

運(yùn)行結(jié)果可知 sum = 13, sum2 = 86
取descendants的第一部分作比較可以發(fā)現(xiàn)

<tr><th>#=============<tr>是soup.find('table',{'id':'giftList'})的子節(jié)點(diǎn)====
Item Title
</th><th>
Description
</th><th>
Cost
</th><th>
Image
</th></tr>#============<tr>是soup.find('table',{'id':'giftList'})的子節(jié)點(diǎn)====
<th>        #============<th>是<tr>的子節(jié)點(diǎn)稽荧，('table',{'id':'giftList'})的子孫節(jié)點(diǎn)==
Item Title
</th>       #============<th>是<tr>的子節(jié)點(diǎn)，('table',{'id':'giftList'})的子孫節(jié)點(diǎn)==

Item Title#=========文本是<th>標(biāo)簽的內(nèi)容，也是子孫節(jié)點(diǎn)================

<th>#============同上====================
Description
</th>

Description

<th>
Cost
</th>

Cost
....

對(duì)比可知窗怒，children只列出了<tr>標(biāo)簽所包含的內(nèi)容。而descendants列出了所有包含的標(biāo)簽節(jié)點(diǎn)以及文本蓄拣，即<tr>子標(biāo)簽中的所有子子孫孫標(biāo)簽都會(huì)查找返回扬虚。

3.2 父節(jié)點(diǎn)

通常情況下我們更經(jīng)常查找子節(jié)點(diǎn)，而在某些特定情況下會(huì)用到查詢(xún)父節(jié)點(diǎn)球恤，.parents 和 .parent辜昵。

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('http://www.pythonscraping.com/pages/warandpeace.html')
soup = BeautifulSoup(html)
print(soup.find('img', {'src':'../img/gifts/img1.jpg'}).parent.previous_sibling.get_text())

分析一下代碼是如何工作的。

<tr>
--<td>
--<td>(3)
    --"$15.00"(4)
--s<td>(2)
    --<img src="../img/gifts/img1.jpg">(1)

1.首先定位到含src="../img/gifts/img1.jpg"的標(biāo)簽img咽斧。
2.選中img標(biāo)簽的父節(jié)點(diǎn)s<td>.
3.選中s<td>的上一個(gè)同層級(jí)標(biāo)簽<td>
4.選取<td>標(biāo)簽中的文字

最后編輯于：2018.02.20 19:50:19

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末堪置，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子张惹，更是在濱河造成了極大的恐慌舀锨，老刑警劉巖宛逗，帶你破解...
沈念sama閱讀 223,207評(píng)論 6贊 521
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件坎匿，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡拧额，警方通過(guò)查閱死者的電腦和手機(jī)碑诉，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,455評(píng)論 3贊 400
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)侥锦，“玉大人进栽，你說(shuō)我怎么就攤上這事」Э眩” “怎么了快毛？”我有些...
開(kāi)封第一講書(shū)人閱讀 170,031評(píng)論 0贊 366
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵格嗅，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我唠帝，道長(zhǎng)屯掖，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 60,334評(píng)論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任襟衰，我火速辦了婚禮贴铜，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘瀑晒。我一直安慰自己绍坝，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 69,322評(píng)論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布苔悦。她就那樣靜靜地躺著轩褐，像睡著了一般。火紅的嫁衣襯著肌膚如雪玖详。梳的紋絲不亂的頭發(fā)上把介，一...
開(kāi)封第一講書(shū)人閱讀 52,895評(píng)論 1贊 314
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音蟋座，去河邊找鬼拗踢。笑死，一個(gè)胖子當(dāng)著我的面吹牛蜈七，可吹牛的內(nèi)容都是我干的秒拔。我是一名探鬼主播，決...
沈念sama閱讀 41,300評(píng)論 3贊 424
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼飒硅，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了作谚？” 一聲冷哼從身側(cè)響起三娩，我...
開(kāi)封第一講書(shū)人閱讀 40,264評(píng)論 0贊 277
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎妹懒，沒(méi)想到半個(gè)月后雀监，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,784評(píng)論 1贊 321
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡眨唬，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,870評(píng)論 3贊 343
?白月光啟示錄
正文我和宋清朗相戀三年会前，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片匾竿。...
茶點(diǎn)故事閱讀 40,989評(píng)論 1贊 354
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡瓦宜，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出岭妖，到底是詐尸還是另有隱情临庇，我是刑警寧澤反璃，帶...
沈念sama閱讀 36,649評(píng)論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站假夺，受9級(jí)特大地震影響淮蜈，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜已卷，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,331評(píng)論 3贊 336
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一梧田、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧侧蘸，春花似錦柿扣、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,814評(píng)論 0贊 25
一樁弒父案未状，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至析桥，卻和暖如春司草，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背泡仗。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,940評(píng)論 1贊 275
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工埋虹，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人娩怎。一個(gè)月前我還...
沈念sama閱讀 49,452評(píng)論 3贊 379
代替公主和親
正文我出身青樓搔课，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親截亦。傳聞我的和親對(duì)象是個(gè)殘疾皇子爬泥，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,995評(píng)論 2贊 361

BeautifulSoup 爬取網(wǎng)絡(luò)數(shù)據(jù)(3)-處理子節(jié)點(diǎn)(children)和其他子孫節(jié)點(diǎn)(descendants)

3. 1子節(jié)點(diǎn)和子孫節(jié)點(diǎn)

3.2 父節(jié)點(diǎn)

推薦閱讀更多精彩內(nèi)容