python最新采集B站美女,還不快學起來求类,下載可能下架視頻

前言

大家早好奔垦、午好、晚好吖 ? ~

image

這個頁面大家認識吧~

喜歡看吧

image

那我們今天就來采集一下它呀~

image

開發(fā)環(huán)境:

  • 版 本: python 3.8

  • 編輯器: pycharm 2022.3.2 專業(yè)版

  • requests >>> pip install requests

  • ffmpeg 音視頻合成軟件

如果安裝python第三方模塊:

  1. win + R 輸入 cmd 點擊確定, 輸入安裝命令 pip install 模塊名 (pip install requests)回車

  2. 在pycharm中點擊Terminal(終端) 輸入安裝命令

實現(xiàn)一個案例的流程:

一. 思路分析

案例的分析 視頻 media .mp4 .mp3 .m4a m3u8視頻流

.m4s: 視頻/音頻 格式

數(shù)據(jù)來源分析: 找到視頻內(nèi)容

network抓包

查看網(wǎng)頁源代碼

  1. 如果在XHR當中沒有找到數(shù)據(jù)

    搜索了, 篩選了 就是找不到

  2. *仔細觀察網(wǎng)頁源代碼

二. 代碼實現(xiàn)(代碼實現(xiàn)基本流程)

  1. 發(fā)送請求 使用代碼的方式訪問網(wǎng)站

  2. 獲取數(shù)據(jù) 取出網(wǎng)頁源代碼

  3. 解析數(shù)據(jù) 提取視頻鏈接

  4. 保存數(shù)據(jù)

image

代碼展示

導入模塊

import requests
import re       # 正則表達式模塊
import json
import pprint
import subprocess
import os

偽裝(請求頭)

headers = {
    # 用戶信息
    "cookie": "buvid3=355AA300-6A61-04E5-A05C-E891D886F69632716infoc; b_nut=1675085932; i-wanna-go-back=-1; _uuid=387EA3810-FBF5-E92C-827E-2510B578C5B9A33232infoc; buvid4=15C69C98-F6A7-EC6A-872F-E69C1840DD6D33724-023013021-1pW1w45e5fZS9RtebDiGZw%3D%3D; nostalgia_conf=-1; CURRENT_FNVAL=4048; rpdid=|(kmJY|k))lY0J'uY~l|)lmY|; SESSDATA=17eb9f1a%2C1690782878%2C6a25c%2A22; bili_jct=4af9076b42f76603dfe4cf018ad2000f; DedeUserID=422789639; DedeUserID__ckMd5=fc4901c78719b545; CURRENT_QUALITY=80; b_ut=5; b_lsid=51ED8F105_1861C3EEC10; theme_style=light; is-2022-channel=1; sid=66dafqju; fingerprint=97ca5a8b555e63aca787c9cd27273c7e; buvid_fp_plain=undefined; buvid_fp=8cc52ae38b592ff26dc2b393eebd890b; PVID=2; innersign=1; bp_video_offset_422789639=758803412994228200",
    # 防盜鏈
    "referer": "https://www.****.com/",
    # 瀏覽器基本信息
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36"
}

發(fā)送請求

url = 'https://www.***.com/video/BV1qv4y1k7UE/?vd_source=8f216a44bce0dbe14e3447c34c2ab3e2'
response = requests.get(url, headers=headers)

獲取數(shù)據(jù)

html_data = response.text

解析數(shù)據(jù)

playinfo=(.*?)</script>

json_str = re.findall('__playinfo__=(.*?)</script>', html_data)[0]
# <h1 .*?>(.*?)</h1>
title = re.findall('<h1 .*?>(.*?)</h1>', html_data)[0]
# Python基礎 字典
json_data = json.loads(json_str)
# pprint.pprint(json_data)
audio_url = json_data['data']['dash']['audio'][0]['baseUrl']
print(audio_url)
video_url = json_data['data']['dash']['video'][0]['baseUrl']
print(video_url)

保存數(shù)據(jù)

audio_data = requests.get(audio_url, headers=headers).content
with open(f'{title}.mp3', mode='wb') as f:
    f.write(audio_data)
video_data = requests.get(video_url, headers=headers).content
with open(f'{title}.mp4', mode='wb') as f:
    f.write(video_data)

ffmpeg = f'ffmpeg -i {title}.mp4 -i {title}.mp3 -acodec copy -vcodec copy {title+"-out.mp4"}'
subprocess.run(ffmpeg)
os.remove(f'{title}.mp4')
image

![


image
image

尾語 ??

好了尸疆,今天的分享就差不多到這里了椿猎!

完整代碼、更多資源寿弱、疑惑解答直接點擊下方名片自取即可犯眠。

有更多建議或問題可以評論區(qū)或私信我哦!一起加油努力叭(? ?_?)?

喜歡就關(guān)注一下博主症革,或點贊收藏評論一下我的文章叭?疬帧!噪矛!

image
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末量蕊,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子艇挨,更是在濱河造成了極大的恐慌残炮,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缩滨,死亡現(xiàn)場離奇詭異势就,居然都是意外死亡,警方通過查閱死者的電腦和手機楷怒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進店門蛋勺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人鸠删,你說我怎么就攤上這事≡籼眨” “怎么了刃泡?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長碉怔。 經(jīng)常有香客問我烘贴,道長,這世上最難降的妖魔是什么撮胧? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任桨踪,我火速辦了婚禮,結(jié)果婚禮上芹啥,老公的妹妹穿的比我還像新娘锻离。我一直安慰自己铺峭,他們只是感情好,可當我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布汽纠。 她就那樣靜靜地躺著卫键,像睡著了一般。 火紅的嫁衣襯著肌膚如雪虱朵。 梳的紋絲不亂的頭發(fā)上莉炉,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天,我揣著相機與錄音碴犬,去河邊找鬼絮宁。 笑死,一個胖子當著我的面吹牛服协,可吹牛的內(nèi)容都是我干的绍昂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼蚯涮,長吁一口氣:“原來是場噩夢啊……” “哼治专!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起遭顶,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤张峰,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后棒旗,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體喘批,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年铣揉,在試婚紗的時候發(fā)現(xiàn)自己被綠了饶深。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡逛拱,死狀恐怖敌厘,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情朽合,我是刑警寧澤俱两,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站曹步,受9級特大地震影響宪彩,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜讲婚,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一尿孔、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦活合、人聲如沸雏婶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽尚骄。三九已至,卻和暖如春侵续,著一層夾襖步出監(jiān)牢的瞬間倔丈,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工状蜗, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留需五,地道東北人。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓轧坎,卻偏偏與公主長得像宏邮,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子缸血,可洞房花燭夜當晚...
    茶點故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容