爬蟲(chóng)練習(xí)之找出B站最受歡迎的編程課程

首先感謝【小甲魚(yú)】極客Python之效率革命咐容。講的很好授药，通俗易懂幅疼，適合入門(mén)晓勇。

感興趣的朋友可以訪問(wèn)https://fishc.com.cn/forum-319-1.html來(lái)支持小甲魚(yú)堂飞。謝謝大家。
想要學(xué)習(xí)requests庫(kù)的可以查閱： https://fishc.com.cn/forum.php?mod=viewthread&tid=95893&extra=page%3D1%26filter%3Dtypeid%26typeid%3D701

要求：找出B站上那些播放量绑咱、彈幕排名靠前的編程類視頻

下面的腳本是直接搜“編程”出現(xiàn)的20條記錄绰筛，我們把標(biāo)題給爬下來(lái)

# -*- coding:UTF-8 -*-
import requests
import bs4

res = requests.get("https://search.bilibili.com/all?keyword=%E7%BC%96%E7%A8%8B&from_source=banner_search")

with open('bilibili.txt', 'w', encoding='utf-8') as file:
    file.write(res.text)
    file.close()

soup = bs4.BeautifulSoup(res.text, 'html.parser')
titles = soup.find_all("li", class_="video matrix")
for each in titles:
    print(each.a['title'])

輸出：

[小甲魚(yú)]零基礎(chǔ)入門(mén)學(xué)習(xí)Python
零基礎(chǔ)自學(xué)編程，不要學(xué)Python描融！| 推薦 2019 年適合學(xué)習(xí)的編程語(yǔ)言
Java零基礎(chǔ)教程視頻（適合Java 0基礎(chǔ)铝噩，Java初學(xué)入門(mén)）
【C++入門(mén)】老九零基礎(chǔ)學(xué)編程C++入門(mén) 老九學(xué)堂 徐嵩老師主講
Python教程_600集Python從入門(mén)到精通教程（懂中文就能學(xué)會(huì)）
程序員直播寫(xiě)代碼，數(shù)十萬(wàn)網(wǎng)友捧場(chǎng)稼稿，看看這段代碼有多牛掰
家里蹲一年半薄榛，從零開(kāi)始做獨(dú)立游戲的心得
大家以為的編程是這樣，然而實(shí)際上...
世界編程大賽前三名作品【每個(gè)exe只有64KB】（附下載鏈接）
當(dāng)你精通了c++是什么感覺(jué)
史上最強(qiáng)C語(yǔ)言入門(mén)基礎(chǔ)教程,從菜鳥(niǎo)到高手,學(xué)完可達(dá)企業(yè)級(jí)水平（1）
【算法】算法導(dǎo)論-麻省理工
自從學(xué)會(huì)了Python让歼，我從來(lái)不為看什么電影發(fā)愁敞恋，好看的，付費(fèi)的谋右，百度不到資源的全部一網(wǎng)打井硬猫！
【完結(jié)C語(yǔ)言視頻】老九零基礎(chǔ)學(xué)編程C語(yǔ)言 老九學(xué)堂 徐嵩老師主講
B站最強(qiáng)程序員耗時(shí)30分鐘 300行代碼，鎮(zhèn)住騰訊高管!騰訊：聘用改执！
【微信小程序】從入門(mén)到入土課程
算法大神帶你玩轉(zhuǎn)數(shù)據(jù)結(jié)構(gòu) 從入門(mén)到進(jìn)階 - 手把手從底層實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)啸蜜，層層深入，幫你提升編程內(nèi)功
程序員面試因年齡大遭嫌棄辈挂，200行代碼寫(xiě)下這個(gè)特效后衬横，收到5份offer
Android精彩編程200例（全彩版）
李南江親授-jQuery+Ajax從放棄到知根知底

如果print出去有編碼問(wèn)題報(bào)錯(cuò)，見(jiàn)另外一篇文章终蒂。

當(dāng)然蜂林，我們也可以根據(jù)綜合排序、最多點(diǎn)擊拇泣、最新發(fā)布噪叙、最多彈幕、最多收藏進(jìn)行排序霉翔；也可以根據(jù)視頻時(shí)長(zhǎng)進(jìn)行排序睁蕾；也可以根據(jù)所屬區(qū)域進(jìn)行排序。

下面寫(xiě)一個(gè)根據(jù)某個(gè)視頻獲得標(biāo)簽的腳本

import requests
import bs4

url = "https://www.bilibili.com/video/av4050443?from=search&seid=10111140175964360887"

def get_html(url):
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}
    res = requests.get(url, headers=headers)

    return res.text

def get_tags(url):
    text = get_html(url)
    soup = bs4.BeautifulSoup(text, "html.parser")
    tags = soup.select("#v_tag > ul > li")  # 主要是這個(gè)去定位標(biāo)簽
    # tags = soup.select("ul[class = 'tag-area clearfix'] > li") 也可以這樣寫(xiě)
    tags = [each.a.text for each in tags]
    return tags

def main():
    text = get_tags(url)
    with open('span.txt', 'a', encoding="utf-8") as file:
        file.write(str(text))
        file.close()

if __name__ == '__main__':
    main()

這樣，只要你給我一個(gè)視頻的URL子眶，我就還你該視頻的標(biāo)簽瀑凝。返回是一個(gè)列表的形式。這樣為下節(jié)課的詞云操作可以提供文本臭杰。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末猜丹，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子硅卢，更是在濱河造成了極大的恐慌射窒，老刑警劉巖，帶你破解...
沈念sama閱讀 217,277評(píng)論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件将塑，死亡現(xiàn)場(chǎng)離奇詭異脉顿，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)点寥，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評(píng)論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)艾疟，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人敢辩，你說(shuō)我怎么就攤上這事蔽莱。” “怎么了戚长？”我有些...
開(kāi)封第一講書(shū)人閱讀 163,624評(píng)論 0贊 353
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵盗冷，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我同廉，道長(zhǎng)仪糖，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,356評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任迫肖，我火速辦了婚禮锅劝，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘蟆湖。我一直安慰自己故爵，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,402評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布隅津。她就那樣靜靜地躺著诬垂，像睡著了一般。火紅的嫁衣襯著肌膚如雪饥瓷。梳的紋絲不亂的頭發(fā)上剥纷，一...
開(kāi)封第一講書(shū)人閱讀 51,292評(píng)論 1贊 301
城市分裂傳說(shuō)
那天痹籍，我揣著相機(jī)與錄音呢铆，去河邊找鬼。笑死蹲缠，一個(gè)胖子當(dāng)著我的面吹牛棺克，可吹牛的內(nèi)容都是我干的悠垛。我是一名探鬼主播，決...
沈念sama閱讀 40,135評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼娜谊，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼确买！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起纱皆，我...
開(kāi)封第一講書(shū)人閱讀 38,992評(píng)論 0贊 275
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤湾趾，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后派草，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體搀缠，經(jīng)...
沈念sama閱讀 45,429評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,636評(píng)論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年近迁，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了艺普。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,785評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡鉴竭，死狀恐怖歧譬，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情搏存，我是刑警寧澤瑰步，帶...
沈念sama閱讀 35,492評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站璧眠，受9級(jí)特大地震影響面氓，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蛆橡，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,092評(píng)論 3贊 328
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一舌界、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧泰演，春花似錦呻拌、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,723評(píng)論 0贊 22
一樁弒父案藐握，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至垃喊，卻和暖如春猾普，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背本谜。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,858評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工初家，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,891評(píng)論 2贊 370
代替公主和親
正文我出身青樓溜在，卻偏偏與公主長(zhǎng)得像陌知，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子掖肋，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,713評(píng)論 2贊 354