Python爬取B站上的小視頻

大家平時(shí)空閑的時(shí)候都會(huì)有刷小視頻的習(xí)慣吧菠赚，我也會(huì)在B站上看一些視頻，今天就和大家分享一個(gè)用Python寫的一個(gè)自動(dòng)爬取Bilibili小視頻的腳本，下面是項(xiàng)目實(shí)現(xiàn)的全部過程。

1.確定爬取目標(biāo)

這次項(xiàng)目入偷，我們爬取的是B站的每日小視頻排行榜前100的視頻資源，爬取的網(wǎng)址為：「http://vc.bilibili.com/p/eden/rank#/?tab=全部」械哟。

2.尋找API接口疏之，生成爬蟲入口

在谷歌瀏覽器中，通過F12打開開發(fā)者模式戒良，然后在NetWorking——Name字段下找到這個(gè)鏈接：http://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset=&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc

在這個(gè)頁面中体捏，再看一下Heagers屬性，找到Request URL這個(gè)屬性值糯崎，當(dāng)我們向下滑動(dòng)加載視頻的過程中，發(fā)現(xiàn)只有這個(gè)（http://api.vc.bilibili.com/board/v1/ranking/top?）URL是不變的河泳。

next_offest屬性值會(huì)一直變化沃呢，它是獲取下一個(gè)視頻的序號(hào)，現(xiàn)在我們需要把這部分參數(shù)取出來拆挥，把next_offest寫成變量值薄霜，用JSON格式返回到目標(biāo)網(wǎng)頁即可。

3.?編寫代碼

根據(jù)上面分析過程編寫代碼纸兔，寫代碼的時(shí)候要注意B站在一定程度上做了反爬操作惰瓜，所以我們需要通過添加請(qǐng)求頭來偽裝瀏覽器，否則下載的視頻是空的汉矿；然后定義參數(shù)來儲(chǔ)存JSON數(shù)據(jù)崎坊，再通過requests.get去獲取其參數(shù)值信息。代碼如下：

defget_json(url):

headers = {

'User-Agent':

'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'

}

params = {

'page_size':10,

'next_offset': str(num),

'tag':'今日熱門',

'platform':'pc'

}

try:

html = requests.get(url,params=params,headers=headers)

returnhtml.json()

exceptBaseException:

print('request error')

pass

為了能清楚的看到下載情況洲拇，在定義一個(gè)下載器奈揍，實(shí)現(xiàn)代碼如下：

def download(url,path):

start= time.time() # 開始時(shí)間

size=0

headers = {

'User-Agent':

'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'

}

response = requests.get(url,headers=headers,stream=True) # stream屬性必須帶上

chunk_size =1024# 每次下載的數(shù)據(jù)大小

content_size =int(response.headers['content-length']) # 總大小

ifresponse.status_code ==200:

print('[文件大小]:%0.2f MB'%(content_size / chunk_size /1024)) # 換算單位

withopen(path,'wb')asfile:

fordatainresponse.iter_content(chunk_size=chunk_size):

file.write(data)

size+=len(data) # 已下載的文件大小

效果如下：

這個(gè)小項(xiàng)目適合爬蟲入門的同學(xué)作為練手項(xiàng)目曲尸，如果有感興趣的同學(xué)，后臺(tái)可以回復(fù)「b站」獲取完整源代碼男翰。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末另患，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子蛾绎，更是在濱河造成了極大的恐慌昆箕，老刑警劉巖，帶你破解...
沈念sama閱讀 218,284評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件租冠，死亡現(xiàn)場(chǎng)離奇詭異鹏倘，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)肺稀，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,115評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門第股，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人话原，你說我怎么就攤上這事夕吻。” “怎么了繁仁？”我有些...
開封第一講書人閱讀 164,614評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵涉馅，是天一觀的道長。經(jīng)常有香客問我黄虱，道長稚矿，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,671評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任捻浦，我火速辦了婚禮晤揣，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘朱灿。我一直安慰自己昧识，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,699評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布盗扒。她就那樣靜靜地躺著跪楞，像睡著了一般。火紅的嫁衣襯著肌膚如雪侣灶。梳的紋絲不亂的頭發(fā)上甸祭，一...
開封第一講書人閱讀 51,562評(píng)論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音褥影，去河邊找鬼池户。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的煞檩。我是一名探鬼主播处嫌，決...
沈念sama閱讀 40,309評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼斟湃！你這毒婦竟也來了熏迹？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,223評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤凝赛，失蹤者是張志新（化名）和其女友劉穎注暗，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體墓猎，經(jīng)...
沈念sama閱讀 45,668評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡捆昏，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,859評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了毙沾。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片骗卜。...
茶點(diǎn)故事閱讀 39,981評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖左胞，靈堂內(nèi)的尸體忽然破棺而出寇仓，到底是詐尸還是另有隱情，我是刑警寧澤烤宙，帶...
沈念sama閱讀 35,705評(píng)論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布遍烦，位于F島的核電站，受9級(jí)特大地震影響躺枕，放射性物質(zhì)發(fā)生泄漏服猪。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,310評(píng)論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一拐云、第九天我趴在偏房一處隱蔽的房頂上張望罢猪。院中可真熱鬧，春花似錦叉瘩、人聲如沸坡脐。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,904評(píng)論 0贊 22
一樁弒父案房揭，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至晌端，卻和暖如春捅暴，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背咧纠。一陣腳步聲響...
開封第一講書人閱讀 33,023評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工蓬痒，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人漆羔。一個(gè)月前我還...
沈念sama閱讀 48,146評(píng)論 3贊 370
代替公主和親
正文我出身青樓梧奢，卻偏偏與公主長得像狱掂，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子亲轨，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,933評(píng)論 2贊 355

Python爬取B站上的小視頻

推薦閱讀更多精彩內(nèi)容