python帶你實(shí)現(xiàn)任意下載AcFun視頻數(shù)據(jù)~

前言 ??

嗨嘍栖榨,大家好呀~這里是愛(ài)看美女的茜茜吶

小姐姐你們喜歡嗎靡挥?反正我是喜歡的纵柿,所以我決定r谧ァ!

今天采集小姐姐視頻~保存下來(lái)供我欣賞

環(huán)境使用:

  • Python 3.8

  • Pycharm

模塊使用:

  • import requests >>> pip install requests

內(nèi)置模塊 你安裝好python環(huán)境就可以了

  • import re

  • import json

如果安裝python第三方模塊:

  1. win + R 輸入 cmd 點(diǎn)擊確定, 輸入安裝命令 pip install 模塊名 (pip install requests) 回車

  2. 在pycharm中點(diǎn)擊Terminal(終端) 輸入安裝命令

基本思路流程: <實(shí)現(xiàn)采集案例基本 通用>

一. 數(shù)據(jù)來(lái)源分析

  1. 明確我們的需求 https://www.acfun.cn/v/ac35510357 這個(gè)視頻內(nèi)容

  2. 分析我們視頻內(nèi)容來(lái)自于哪里

通過(guò)開(kāi)發(fā)者工具進(jìn)行抓包分析:

  • F12 或者 鼠標(biāo)右鍵點(diǎn)擊檢查

  • 分析數(shù)據(jù)在那個(gè)數(shù)據(jù)包里面 這個(gè)網(wǎng)站數(shù)據(jù)是不是m3u8需要自己判斷

m3u8 好處是什么, 你看多少內(nèi)容就給你加載多少內(nèi)容, 你看三秒就給你加載三秒, 綠色雙人愛(ài)情.....<>

正常的視頻內(nèi)容: MP4 2分鐘18秒

m3u8 分片段 ---> 分為很多小片段 <ts文件>, 一個(gè)小片段只有幾秒鐘的時(shí)間

我想要獲取整個(gè)視頻內(nèi)容, 獲取所有ts文件, 所有ts文件又保存在m3u8的文件里面

想要視頻內(nèi)容 ---> 分片段 ts文件 ---> m3u8文件里面 ---> 在網(wǎng)頁(yè)源代碼里面

二. 代碼實(shí)現(xiàn)步驟: 爬蟲(chóng)基本四大步驟:

  1. 發(fā)送請(qǐng)求, 對(duì)于視頻詳情頁(yè)url地址發(fā)送請(qǐng)求

  2. 獲取數(shù)據(jù), 獲取服務(wù)器返回響應(yīng)數(shù)據(jù)

  3. 解析數(shù)據(jù), 提取我們要的 m3u8文件鏈接

  4. 發(fā)送請(qǐng)求, 對(duì)于 m3u8文件鏈接 發(fā)送請(qǐng)求

  5. 獲取數(shù)據(jù), 獲取服務(wù)器返回響應(yīng)數(shù)據(jù)

  6. 解析數(shù)據(jù), 提取我們要的 所有ts文件鏈接

  7. 保存數(shù)據(jù), 把視頻片段全部保存下載, 合成為一個(gè)整體視頻內(nèi)容

代碼

導(dǎo)入模塊

# 導(dǎo)入數(shù)據(jù)請(qǐng)求模塊 ---> 第三方模塊 需要 在cmd里面進(jìn)行 pip install requests
import requests
# 導(dǎo)入re正則模塊  ---> 內(nèi)置模塊 不需要安裝
import re
# 導(dǎo)入json模塊   ---> 內(nèi)置模塊 不需要安裝
import json
# 導(dǎo)入格式化輸出模塊   ---> 內(nèi)置模塊 不需要安裝
from pprint import pprint
# 導(dǎo)入進(jìn)度條模塊 ---> 第三方模塊 需要 在cmd里面進(jìn)行 pip install tqdm
from tqdm import tqdm
# 導(dǎo)入tk GUI模塊
import tkinter as tk
import tkinter.messagebox
def get_response(html_url):
    """
    發(fā)送請(qǐng)求函數(shù)
    :param html_url: 請(qǐng)求鏈接
    :return: 響應(yīng)對(duì)象
    """
    # 偽裝瀏覽器 headers ---> 開(kāi)發(fā)者工具里面復(fù)制粘貼
    headers = {
        # 瀏覽器基本身份信息
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
    }
    # 發(fā)送請(qǐng)求 <Response [200]> 響應(yīng)對(duì)象
    response = requests.get(url=html_url, headers=headers)
    return response
def get_video_info(video_id):
    """
    獲取信息數(shù)據(jù)
    :param video_id: 視頻ID
    :return: 視頻數(shù)據(jù)
    """
    video_url = f'https://www.acfun.cn/v/ac{video_id}'
    response = get_response(video_url)
    # 提取視頻標(biāo)題
    title = re.findall('"title":"(.*?)",', response.text)[1]
    # 獲取m3u8
    html_data = re.findall('window.pageInfo = window.videoInfo = (.*?);', response.text)[0]
    # 轉(zhuǎn)換數(shù)據(jù)類型
    json_data = json.loads(html_data)
    # 字典取值, 鍵值對(duì) ---> 根據(jù)冒號(hào)左邊的內(nèi)容[鍵], 提取冒號(hào)右邊的內(nèi)容[值]
    m3u8_url = \
        json.loads(json_data['currentVideoInfo']['ksPlayJson'])['adaptationSet'][0]['representation'][0]['backupUrl'][0]
    # 4. 發(fā)送請(qǐng)求, 對(duì)于 m3u8文件鏈接 發(fā)送請(qǐng)求  5. 獲取數(shù)據(jù), 獲取服務(wù)器返回響應(yīng)數(shù)據(jù)
    m3u8_data = get_response(m3u8_url).text
    # 6. 解析數(shù)據(jù)
    m3u8_data = re.sub('#E.*', '', m3u8_data).split()
    # 列表推導(dǎo)式
    ts_url_list = ['https://ali-safety-video.acfun.cn/mediacloud/acfun/acfun_video/' + ts for ts in m3u8_data]
    return title, ts_url_list
def save(title, ts_url):
    """
    保存數(shù)據(jù)
    :param title: 視頻標(biāo)題
    :param ts_url: ts鏈接
    :return:
    """
    ts_content = get_response(ts_url).content
    with open('video\\' + title + '.mp4', 'ab') as f:
        f.write(ts_content)
def main():
    """
    主函數(shù)
    :param video_id:
    :return:
    """
    video_id = Va.get()
    # 獲取視頻數(shù)據(jù)信息
    title, ts_url_list = get_video_info(video_id)
    for ts_url in tqdm(ts_url_list):
        save(title, ts_url)
    tk.messagebox.showinfo(title='溫馨提示', message=f'{title}下載完成')
if __name__ == '__main__':
    # main('35556211')
    # 實(shí)例化對(duì)象
    root = tk.Tk()
    # 設(shè)置標(biāo)題
    root.title('小視頻下載')
    # 設(shè)置大小
    root.geometry('424x115+200+200')
    # 設(shè)置可變變量
    Va = tk.StringVar()
    # 設(shè)置文字
    tk.Label(root, text='僅提供學(xué)習(xí)交流', font=('黑體', 15)).grid(row=0, column=2)
    tk.Label(root, text='輸入視頻ac號(hào): ', font=('黑體', 15)).grid(row=1, column=1)
    # 設(shè)置輸入框
    tk.Entry(root, textvariable=Va).grid(row=1, column=2)
    # 設(shè)置按鈕
    tk.Button(root, text='下載', font=('黑體'), command=main).grid(row=1, column=3)
    # 顯示窗口
    root.mainloop()

尾語(yǔ) ??

感謝你觀看我的文章吶~本次航班到這里就結(jié)束啦 ??

希望本篇文章有對(duì)你帶來(lái)幫助 ??昂儒,有學(xué)習(xí)到一點(diǎn)知識(shí)~

躲起來(lái)的星星??也在努力發(fā)光沟使,你也要努力加油(讓我們一起努力叭)。

最后荆忍,博主要一下你們的三連呀(點(diǎn)贊格带、評(píng)論、收藏)刹枉,不要錢(qián)的還是可以搞一搞的嘛~

不知道評(píng)論啥的叽唱,即使扣個(gè)6666也是對(duì)博主的鼓舞吖 ?? 感謝 ??

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市微宝,隨后出現(xiàn)的幾起案子棺亭,更是在濱河造成了極大的恐慌,老刑警劉巖蟋软,帶你破解...
    沈念sama閱讀 206,723評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件镶摘,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡岳守,警方通過(guò)查閱死者的電腦和手機(jī)凄敢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)湿痢,“玉大人涝缝,你說(shuō)我怎么就攤上這事扑庞。” “怎么了拒逮?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,998評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵罐氨,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我滩援,道長(zhǎng)栅隐,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,323評(píng)論 1 279
  • 正文 為了忘掉前任玩徊,我火速辦了婚禮租悄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘恩袱。我一直安慰自己恰矩,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布憎蛤。 她就那樣靜靜地躺著外傅,像睡著了一般。 火紅的嫁衣襯著肌膚如雪俩檬。 梳的紋絲不亂的頭發(fā)上萎胰,一...
    開(kāi)封第一講書(shū)人閱讀 49,079評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音棚辽,去河邊找鬼技竟。 笑死,一個(gè)胖子當(dāng)著我的面吹牛屈藐,可吹牛的內(nèi)容都是我干的榔组。 我是一名探鬼主播,決...
    沈念sama閱讀 38,389評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼联逻,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼搓扯!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起包归,我...
    開(kāi)封第一講書(shū)人閱讀 37,019評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤锨推,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后公壤,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體换可,經(jīng)...
    沈念sama閱讀 43,519評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評(píng)論 2 325
  • 正文 我和宋清朗相戀三年厦幅,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了沾鳄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,100評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡确憨,死狀恐怖译荞,靈堂內(nèi)的尸體忽然破棺而出套媚,到底是詐尸還是另有隱情,我是刑警寧澤磁椒,帶...
    沈念sama閱讀 33,738評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站玫芦,受9級(jí)特大地震影響浆熔,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜桥帆,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評(píng)論 3 307
  • 文/蒙蒙 一医增、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧老虫,春花似錦叶骨、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,289評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至夺欲,卻和暖如春跪帝,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背些阅。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,517評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工伞剑, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人市埋。 一個(gè)月前我還...
    沈念sama閱讀 45,547評(píng)論 2 354
  • 正文 我出身青樓黎泣,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親缤谎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子抒倚,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容