Beautiful
優(yōu)點(diǎn)
不用擔(dān)心編碼方式的問(wèn)題 蟀瞧,因?yàn)橐呀?jīng)內(nèi)置處理好了,會(huì)自動(dòng)將輸入文檔轉(zhuǎn)換Unicode編碼,輸出轉(zhuǎn)換UTF-8編碼
#基本用法
#選擇元素
- 通過(guò)標(biāo)簽選擇
- 通過(guò)CSS選擇器選擇
- 獲取屬性
attrs
- 獲取文本
get_text()
- 獲取屬性
- 方法選擇器
-
find()
返回單個(gè)元素 find_parents()
find_parent()
find_next_siblings()
find_next_siling()
-
#提取信息
- 獲取標(biāo)簽信息
name
字符串 - 獲取文本信息
string
字符串 - 獲取屬性信息
attrs
字典
#嵌套選擇
print(soup.head.title)
#關(guān)聯(lián)選擇
- 子節(jié)點(diǎn)與子孫節(jié)點(diǎn)
contents/children | descendants
- 父節(jié)點(diǎn)與祖先節(jié)點(diǎn)
parent| parents
- 兄弟節(jié)點(diǎn)
-
next_sibling
下一個(gè)兄弟節(jié)點(diǎn) -
next_siblings
所有后面的兄弟節(jié)點(diǎn) -
previous_sibling
上一個(gè)兄弟節(jié)點(diǎn) -
previous_siblings
所有前面的兄弟節(jié)點(diǎn)
-