0.寫在前面
在python的爬蟲中,經(jīng)常需要用到強大的beautifulsoup庫涧郊,如之前寫的股票數(shù)據(jù)的爬取中就用到了它飒泻。在這里,將詳細總結beautifulsoup的用法噪窘,來鞏固相關知識笋庄。以下便是我從各種網(wǎng)站搜集的資料,在這里做一個匯總倔监。(我從不生產(chǎn)知識直砂,我只是知識的搬運工)
1.基本介紹
2.安裝/引用
安裝:win平臺中‘以管理員身份運行’cmd,執(zhí)行pip install beautifulsoup4
即可安裝
引用:from bs4 import BeautifulSoup
或import bs4
即可
3.使用方法
如果不想輸出內(nèi)容的注釋浩习,可以寫一個if語句:
if type(newsoup.b.string)==element.Comment:
print (newsoup.b.string)
bs4庫將任何HTML輸入都變成utf-8編碼,python3.x默認支持編碼是utf-8編碼静暂,解析無障礙
本文參考中國大學MOOC / kikaylee的專欄