今日頭條上發(fā)布的視頻都是跳轉(zhuǎn)到陽光寬頻這個(gè)網(wǎng)站,那么我們來分析一下具體該怎么爬瞭亮。一樣,先分析接口以及接口返回?cái)?shù)據(jù)
https://www.toutiao.com/search_content/?offset=20&format=json&keyword=%E7%A4%BE%E5%8C%BA%E6%96%B0%E9%9B%B6%E5%94%AE&autoload=true&count=20&cur_tab=2&from=video
跟綜合的接口有點(diǎn)差異就是cur_tab 和from這兩個(gè)參數(shù)匈棘,其他的沒有什么變化飘蚯,該接口返回的只是相關(guān)的視頻列表還沒有拿到真正的視頻現(xiàn)在地址,總之先拿到視頻播放頁的入口地址艳吠,接下來我們再來看如何拿到真正的播放地址麦备。隨便打開一個(gè)視頻地址,然后分析網(wǎng)頁結(jié)構(gòu),再次失望了凛篙,不過網(wǎng)頁上采用vedio標(biāo)簽播放視頻黍匾,不是采用流媒體播放,既然這樣就存在著可能鞋诗。再次分析播放頁面的請求接口膀捷,發(fā)現(xiàn)一個(gè)有用的接口
http://ib.365yg.com/video/urls/v/1/toutiao/mp4/12531bab86f5416f8f21e1fdf1a07559?r=22820976088276734&s=1292880202&callback=axiosJsonpCallback1&_=1538793938274
這個(gè)接口用于返回視頻的真實(shí)地址,查看數(shù)據(jù)結(jié)構(gòu)
在vedio_list這個(gè)key值下就是我們真實(shí)的播放地址了削彬,想想都好激動(dòng)
打開一看全庸,懵逼了,這是什么鬼融痛,說好的地址了壶笼,直接百度了一下,好家伙雁刷,已經(jīng)有大神指明了覆劈,這個(gè)main_url就是真實(shí)的地址,只不過是經(jīng)過base64編碼了沛励,直接用base64解碼责语,果然拿到了真實(shí)的地址。代碼不難目派,所以沒有系統(tǒng)的寫代碼坤候,我們看到vedio_list中有三個(gè)值,只是針對于不同的分辨率企蹭,大家可以根據(jù)自己的需求進(jìn)行獲取白筹。