首先感謝【小甲魚(yú)】極客Python之效率革命咐容。講的很好授药,通俗易懂幅疼,適合入門(mén)晓勇。
感興趣的朋友可以訪問(wèn)https://fishc.com.cn/forum-319-1.html來(lái)支持小甲魚(yú)堂飞。謝謝大家。
想要學(xué)習(xí)requests庫(kù)的可以查閱: https://fishc.com.cn/forum.php?mod=viewthread&tid=95893&extra=page%3D1%26filter%3Dtypeid%26typeid%3D701
要求:找出B站上那些播放量绑咱、彈幕排名靠前的編程類視頻
下面的腳本是直接搜“編程”出現(xiàn)的20條記錄绰筛,我們把標(biāo)題給爬下來(lái)
# -*- coding:UTF-8 -*-
import requests
import bs4
res = requests.get("https://search.bilibili.com/all?keyword=%E7%BC%96%E7%A8%8B&from_source=banner_search")
with open('bilibili.txt', 'w', encoding='utf-8') as file:
file.write(res.text)
file.close()
soup = bs4.BeautifulSoup(res.text, 'html.parser')
titles = soup.find_all("li", class_="video matrix")
for each in titles:
print(each.a['title'])
輸出:
[小甲魚(yú)]零基礎(chǔ)入門(mén)學(xué)習(xí)Python
零基礎(chǔ)自學(xué)編程,不要學(xué)Python描融!| 推薦 2019 年適合學(xué)習(xí)的編程語(yǔ)言
Java零基礎(chǔ)教程視頻(適合Java 0基礎(chǔ)铝噩,Java初學(xué)入門(mén))
【C++入門(mén)】老九零基礎(chǔ)學(xué)編程C++入門(mén) 老九學(xué)堂 徐嵩老師主講
Python教程_600集Python從入門(mén)到精通教程(懂中文就能學(xué)會(huì))
程序員直播寫(xiě)代碼,數(shù)十萬(wàn)網(wǎng)友捧場(chǎng)稼稿,看看這段代碼有多牛掰
家里蹲一年半薄榛,從零開(kāi)始做獨(dú)立游戲的心得
大家以為的編程是這樣,然而實(shí)際上...
世界編程大賽前三名作品【每個(gè)exe只有64KB】(附下載鏈接)
當(dāng)你精通了c++是什么感覺(jué)
史上最強(qiáng)C語(yǔ)言入門(mén)基礎(chǔ)教程,從菜鳥(niǎo)到高手,學(xué)完可達(dá)企業(yè)級(jí)水平(1)
【算法】算法導(dǎo)論-麻省理工
自從學(xué)會(huì)了Python让歼,我從來(lái)不為看什么電影發(fā)愁敞恋,好看的,付費(fèi)的谋右,百度不到資源的全部一網(wǎng)打井硬猫!
【完結(jié)C語(yǔ)言視頻】老九零基礎(chǔ)學(xué)編程C語(yǔ)言 老九學(xué)堂 徐嵩老師主講
B站最強(qiáng)程序員耗時(shí)30分鐘 300行代碼,鎮(zhèn)住騰訊高管!騰訊:聘用改执!
【微信小程序】從入門(mén)到入土課程
算法大神帶你玩轉(zhuǎn)數(shù)據(jù)結(jié)構(gòu) 從入門(mén)到進(jìn)階 - 手把手從底層實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)啸蜜,層層深入,幫你提升編程內(nèi)功
程序員面試因年齡大遭嫌棄辈挂,200行代碼寫(xiě)下這個(gè)特效后衬横,收到5份offer
Android精彩編程200例(全彩版)
李南江親授-jQuery+Ajax從放棄到知根知底
如果print出去有編碼問(wèn)題報(bào)錯(cuò),見(jiàn)另外一篇文章终蒂。
當(dāng)然蜂林,我們也可以根據(jù)綜合排序、最多點(diǎn)擊拇泣、最新發(fā)布噪叙、最多彈幕、最多收藏進(jìn)行排序霉翔;也可以根據(jù)視頻時(shí)長(zhǎng)進(jìn)行排序睁蕾;也可以根據(jù)所屬區(qū)域進(jìn)行排序。
下面寫(xiě)一個(gè)根據(jù)某個(gè)視頻獲得標(biāo)簽的腳本
import requests
import bs4
url = "https://www.bilibili.com/video/av4050443?from=search&seid=10111140175964360887"
def get_html(url):
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}
res = requests.get(url, headers=headers)
return res.text
def get_tags(url):
text = get_html(url)
soup = bs4.BeautifulSoup(text, "html.parser")
tags = soup.select("#v_tag > ul > li") # 主要是這個(gè)去定位標(biāo)簽
# tags = soup.select("ul[class = 'tag-area clearfix'] > li") 也可以這樣寫(xiě)
tags = [each.a.text for each in tags]
return tags
def main():
text = get_tags(url)
with open('span.txt', 'a', encoding="utf-8") as file:
file.write(str(text))
file.close()
if __name__ == '__main__':
main()