站在巨人的肩膀上抓取vip視頻播放地址

站在巨人的肩膀上抓取vip視頻播放地址

此文章僅僅為練習(xí)簡(jiǎn)單爬蟲(chóng)所作.

簡(jiǎn)單爬蟲(chóng)三步曲

1.明確需求,找到能夠滿足需求的網(wǎng)頁(yè)

目標(biāo):給我一個(gè)官方播放vip電影的地址,輸出一個(gè)能夠放在瀏覽器直接播放電影的鏈接

如何解析各大主流視頻網(wǎng)站的視頻原播放地址,已經(jīng)有巨人做好了.搜索視頻解析 這里僅僅做個(gè)猜想:前期需要對(duì)播放視頻網(wǎng)站進(jìn)行抓包,篩掉無(wú)關(guān)請(qǐng)求,挨個(gè)分析剩下的.從后往前分析會(huì)更好,因?yàn)樽罱K一定有可以可以播放的鏈接被抓包到,并且現(xiàn)在電影多數(shù)都是分段式的,一個(gè)電影可以分成成百上千個(gè)小段.這些小段視頻鏈接的拼接規(guī)則則要去前面的請(qǐng)求分析得來(lái),不多贅述.

我們搜索解析視頻后直接選取第一個(gè)全民解析-vip視頻在線解析 借助這個(gè)視頻解析平臺(tái)實(shí)現(xiàn)既定的需求.

2.分析網(wǎng)頁(yè)html,定位目標(biāo)數(shù)據(jù)

可以看到
屏幕快照 2018-07-25 下午2.54.33.png

在播放地址欄粘貼原官方播放地址后點(diǎn)擊Go-點(diǎn)擊開(kāi)始解析稍等即可播放

看看點(diǎn)擊時(shí)觸發(fā)什么事件.右擊按鈕,選擇檢查即可定位到指定html元素位置.


點(diǎn)擊定位.png

我們可以發(fā)現(xiàn)到一個(gè)叫做dihejk()的點(diǎn)擊事件,分析后發(fā)現(xiàn)它最終要拿到下面三個(gè)option中的選中的一個(gè)的value.

 <option value="http://jx.598110.com/zuida.php?url=" selected="">③號(hào)通用vip引擎系統(tǒng)【穩(wěn)定通用】</option>
 <option value="http://jx.598110.com/duo/index.php?url=" selected="">②號(hào)通用vip多線路系統(tǒng)【穩(wěn)定通用】</option> 
 <option value="http://jx.598110.com/index.php?url=" selected="">①號(hào)通用vip引擎系統(tǒng)【穩(wěn)定通用】</option> 

選擇http://jx.598110.com/zuida.php?url= 嘗試在 url后拼接上視頻官方播放的地址,在瀏覽器中粘貼竟短暫等待后就直接播放了.

3.爬取整個(gè)html內(nèi)容,寫(xiě)正則將目標(biāo)數(shù)據(jù)揪出來(lái)

那么接下來(lái)的事情就是寫(xiě)代碼爬取這個(gè)網(wǎng)站的html.將這三個(gè) option value的值匹配出來(lái).上代碼

import re
from urllib import request


if __name__ == '__main__':
    # 視頻原播放url  示例: http://www.iqiyi.com/v_19rr9tql50.html
    origin_vip_url = input('please input original url')

    # 這個(gè)網(wǎng)頁(yè)中藏著用于解析視頻播放url的url們
    qmail_url = 'http://www.qmaile.com/'

    # head配置
    head = {
        'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
        'Referer': "http://www.qmaile.com/"
    }

    # 創(chuàng)建一個(gè)request
    qmail_url_req = request.Request(url = qmail_url, headers = head)

    # 獲得數(shù)據(jù)
    qmail_url_res = request.urlopen(qmail_url_req)

    # 轉(zhuǎn)換成html
    res_html = qmail_url_res.read().decode('utf-8')

    # 正則
    pat = '<option value="(.*?)\?'

    # 找出三個(gè)用于解析視頻地址的目標(biāo)url們
    target_parse_urls = re.findall(pat, res_html, re.S)

    result_play_url = []
    if len(target_parse_urls) > 0:
        for each_parse_url in target_parse_urls:
            each_play_url = each_parse_url + '?' + 'url=' + origin_vip_url
            result_play_url.append(each_play_url)

    else:
        print('沒(méi)有找到')

    # 最后一個(gè)比較好使
    print(result_play_url)


在命令行執(zhí)行該模塊,輸入想解析的官方播放地址,即可生成三個(gè)直接播放地址.
換一個(gè)平臺(tái)基本上也就是差不多的流程.借助別人的平臺(tái),實(shí)現(xiàn)這個(gè)需求似乎并不難.難的是解析視頻的過(guò)程,下次再深入討論

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌唧喉,老刑警劉巖减牺,帶你破解...
    沈念sama閱讀 212,599評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡莺治,警方通過(guò)查閱死者的電腦和手機(jī)鸿秆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)酌畜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人卿叽,你說(shuō)我怎么就攤上這事桥胞。” “怎么了考婴?”我有些...
    開(kāi)封第一講書(shū)人閱讀 158,084評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵贩虾,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我沥阱,道長(zhǎng)缎罢,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,708評(píng)論 1 284
  • 正文 為了忘掉前任考杉,我火速辦了婚禮策精,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘崇棠。我一直安慰自己蛮寂,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,813評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布易茬。 她就那樣靜靜地躺著酬蹋,像睡著了一般。 火紅的嫁衣襯著肌膚如雪抽莱。 梳的紋絲不亂的頭發(fā)上范抓,一...
    開(kāi)封第一講書(shū)人閱讀 50,021評(píng)論 1 291
  • 那天,我揣著相機(jī)與錄音食铐,去河邊找鬼匕垫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛虐呻,可吹牛的內(nèi)容都是我干的象泵。 我是一名探鬼主播,決...
    沈念sama閱讀 39,120評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼斟叼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼偶惠!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起朗涩,我...
    開(kāi)封第一講書(shū)人閱讀 37,866評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤忽孽,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體兄一,經(jīng)...
    沈念sama閱讀 44,308評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡厘线,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,633評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了出革。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片造壮。...
    茶點(diǎn)故事閱讀 38,768評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖骂束,靈堂內(nèi)的尸體忽然破棺而出耳璧,到底是詐尸還是另有隱情,我是刑警寧澤栖雾,帶...
    沈念sama閱讀 34,461評(píng)論 4 333
  • 正文 年R本政府宣布楞抡,位于F島的核電站,受9級(jí)特大地震影響析藕,放射性物質(zhì)發(fā)生泄漏召廷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,094評(píng)論 3 317
  • 文/蒙蒙 一账胧、第九天 我趴在偏房一處隱蔽的房頂上張望竞慢。 院中可真熱鬧,春花似錦治泥、人聲如沸筹煮。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,850評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)败潦。三九已至,卻和暖如春准脂,著一層夾襖步出監(jiān)牢的瞬間劫扒,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,082評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工狸膏, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留沟饥,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,571評(píng)論 2 362
  • 正文 我出身青樓湾戳,卻偏偏與公主長(zhǎng)得像贤旷,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子砾脑,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,666評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容