序言
有的人之所以能夠成事癣丧,除了自身的能力驶乾、天賦级解、背景之外伊约,他們還有一種成功的特質(zhì),那就是專注力兽愤,他們能夠?qū)W⒂谝患卤四睿幌肫渌ㄟ^不斷地實(shí)踐浅萧,就努力去做好這件事逐沙,這樣就不容易被外界環(huán)境所干擾和造成影響。
他們會不惜一切代價(jià)洼畅,會花費(fèi)大量的時(shí)間和精力去做好它酱吝,熟能生巧,到時(shí)候即使不成功土思,也是有巨大收獲的务热。
我也始終堅(jiān)信,我們每個(gè)人的潛力都是不可估量的己儒,只要努力去做崎岂,想做的事情,總是會取得很大的效果的闪湾。
實(shí)戰(zhàn)
image.png
代碼實(shí)戰(zhàn)
我這里采用的是自動化采集冲甘,當(dāng)然也有別的方式哈;大家可自行研究一下途样。
from selenium import webdriver
from lxml import etree
import pandas as pd
# 數(shù)據(jù)列表
urls = []
title = []
views = []
wd = webdriver.Chrome(r'C:\Users\Tony\PycharmProjects\Module_Tony_Demo\Moudle\chromedriver.exe')
# 請求
wd.get('https://search.bilibili.com/all?keyword=%E7%AC%91%E8%AF%9D&from_source=web_search')
# 獲取首頁HTML
f = wd.page_source
page = etree.HTML(f)
up = page.xpath('//a[@class="up-name"]/text()')
q = page.xpath('//li[@class="video-item matrix"]')
# 獲取二級頁面 url江醇,標(biāo)題
for i in q:
url = 'https:' + i.xpath('./a/@href')[0]
title.append(i.xpath('./a/@title')[0])
urls.append(url)
# 二級頁面數(shù)據(jù)獲取
def two(tex):
text = etree.HTML(tex)
ll = text.xpath('//div[@class="video-data"]')
for i in ll:
view = i.xpath('./span[@class="view"]/@title')[0]
view = view.replace("總播放數(shù)", "")
views.append(view)
for m, k in enumerate(urls):
try:
wd.get(k)
tt = wd.page_source
two(tt)
except:
print('出現(xiàn)空值%s' % (m + 1))
# 存儲
writer = {'播放量': views}
uu = pd.DataFrame(writer)
uu.to_excel('笑話視頻觀看人數(shù).xlsx', index=0)
image.png