在html 中填寫網(wǎng)頁編碼桥氏,運(yùn)行程序拿穴,去掉網(wǎng)頁標(biāo)簽胀滚,僅提取其中的網(wǎng)頁文本內(nèi)容:
from bs4 import BeautifulSoup
def extract_span_text(html_content):
# 使用 BeautifulSoup 解析 HTML
soup = BeautifulSoup(html_content, 'html.parser')
# 找到所有的 span 標(biāo)簽
span_tags = soup.find_all('span')
# 提取每個 span 標(biāo)簽中的文本內(nèi)容
span_texts = [span.get_text() for span in span_tags]
# 返回所有文本內(nèi)容的列表
return span_texts
# 使用示例
html = """
"""
result = extract_span_text(html)
for text in result:
print(text)