什么是爬蟲玖喘?
就是抓取網(wǎng)頁數(shù)據(jù)的程序
爬蟲怎么抓取網(wǎng)頁數(shù)據(jù)?
網(wǎng)頁三大特征:
網(wǎng)頁都有自己唯一的URL蘑志。
網(wǎng)頁都是HTML來描述頁面信息累奈。
網(wǎng)頁都使用http/https協(xié)議來傳輸HTML數(shù)據(jù)。
爬蟲的設計思路:
獲取視頻ID
拼接完整url
獲取視頻播放地址
下載視頻
模塊使用 requests
安裝“pip install requests”
推薦下我自己創(chuàng)建的Python學習交流群960410445急但,這是Python學習交流的地方澎媒,不管你是小白還是大牛,小編都歡迎波桩,不定期分享干貨戒努,包括我整理的一份適合零基礎學習Python的資料和入門教程。
Requests庫的七個主要方法
找到單個視頻播放地址
獲取網(wǎng)頁源代碼
獲取播放地址
下載視頻