前前言
喜馬拉雅已經(jīng)更換標(biāo)簽,我重新更新了下代碼少漆,文章暫時未改臼膏,因為思路還是如此,需要的可以掃一下文末公眾號二維碼(本人會在上面發(fā)表爬蟲以及java的文章還有送書等資源福利哦)示损,也可以直接搜索公眾號“ 猿獅的單身日成酰”,好了廣告結(jié)束...
前言
之前寫過爬取圖片的一篇文章始鱼,這回來看看如何爬取音頻论巍。圖片状勤,音頻鞋怀,視頻這類都可以通過二進制方式保存到本地下載下來。
爬取圖片文章的鏈接:?python爬取圖片并以二進制方式保存到本地
目標(biāo)
本次我們爬取的目標(biāo)是--喜馬拉雅FM
這里寫圖片描述
喜馬拉雅FM有數(shù)不計的音頻持搜,這些音頻都有自己的分類密似,所以進一步給自己拋出一個需求,?爬取喜馬拉雅所有分類的音頻
接下來我們來分析這些分類葫盼,找到所有分類?https://www.ximalaya.com/category/
這里寫圖片描述
我們可以看到這里包括了大量的分類残腌,那么我們找一個分類來看看其內(nèi)部是怎樣的
這里寫圖片描述
這里我們可以看到文學(xué)類下面的諸多FM節(jié)目,那么點開節(jié)目贫导,?有的需要充值抛猫,有的免費,還有很多頁這樣的節(jié)目
這里寫圖片描述
繼續(xù)跟進孩灯,可以看到闺金,我們需要爬取的音頻列表了!
好了峰档,所以現(xiàn)在目標(biāo)已經(jīng)清晰起來了: 找到所有分類 -> 對每一個分類败匹,獲取其中所有頁的FM節(jié)目->對每一個FM節(jié)目,爬取其下列表里的所有免費的音頻
開始動刀
第一步
代碼如下:
category_Url ='https://www.ximalaya.com/category/'base_url ='https://www.ximalaya.com'base_api ='https://www.ximalaya.com/revision/play/tracks?trackIds='header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36'}client = pymongo.MongoClient(host='localhost', port=27017)db = client['ximalaya']defgetUrl():r = requests.get(category_Url, headers=header) html = r.text result = re.findall(r'<a class="e-2880429693 item separator".*?href="(.*?)">(.*?)</a>', html, re.S) url_list = []foriinresult:# 以一個分類為例 - - 有聲書中的文學(xué)類讥巡,若沒有break 則可獲取全部分類second_url = base_url + i[0] url_list.append(second_url)# 獲取該分類中全部的頁數(shù)getMorePage(second_url)printsecond_urlbreak
分析每個分類的標(biāo)簽掀亩,獲取網(wǎng)頁源碼中的所有分類,這里的?category_Url?是上面提到的所有分類得界面的URL
還定義一些要用到的基本的欢顷,比如請求頭槽棍、連接MongoDB等, 在這里添加了break吱涉,是因為音頻數(shù)過多刹泄,所以以有聲書為例
第二步
defgetMorePage(url):r = requests.get(url, headers=header) m_list_html = r.text pageNum = re.findall(r'(\d+)</span></a></li><li class="e-3793817119 page-next page-item">', m_list_html,re.S) pageNum = int(pageNum[0])# 循環(huán)獲取每一頁外里,這里暫時獲取第一頁foriinrange(1, pageNum +1):ifi ==1: page_url = url# 獲取頁中的30個FMgetMusicList(page_url, i)else: page_url = url +'p{}/'.format(i) getMusicList(page_url, i)#爬取一頁break
進入一個分類后怎爵,可以看到很多頁的FM節(jié)目,所以應(yīng)該想辦法循環(huán)獲取頁面的內(nèi)容盅蝗,這里我們發(fā)現(xiàn)?頁面數(shù)在網(wǎng)頁源碼中存在?鳖链,通過正則我們將其取出,然后循環(huán)
這里我們注意一下其頁面的url :
https://www.ximalaya.com/youshengshu/wenxue/p2/
后面的p2對應(yīng)頁數(shù),而第一頁沒有p芙委,所以需要判斷逞敷,這里也同樣以第一頁為例
第三步
defgetMusicList(url, page):r = requests.get(url, headers=header) m_list_html = r.text result = re.findall(r'<a class="e-1889510108.*?href="(.*?)"><img.*?src="(.*?)".*?alt="(.*?)".*?/>.*?"e-1889510108 icon-earphone xuicon xuicon-erji"></i>(.*?)</span>.*?"e-2896848410 album-author".*?title="(.*?)">', m_list_html, re.S) info = []# 獲取該page中每一個FM的數(shù)據(jù)信息,可以存入MongoDBforiinresult: FM_info = {}#每個節(jié)目的urlFM_url = base_url + i[0]? FM_info['url'] = FM_url FM_info['picture'] = i[1] FM_info['name'] = i[2] FM_info['playback'] = i[3] FM_info['author'] = i[4] info.append(FM_info)# 獲取該FM中的音頻信息# os.mkdir('D:\\Python\\PycharmProject\\Enhance\\xmly_fm\\{}'.format(FM_info['name']))get_FM_music(FM_url)# 先獲取一個FM# for j in info:# print jtest = db['page'+ str(page)] test.insert(info)
以每頁的url為參數(shù)傳入?getMusicList()?獲取每一頁中的30個FM節(jié)目信息灌侣,可以將每個節(jié)目的信息存入到MongoDB中推捐;然后是獲取每個節(jié)目中的音頻
第四步
defget_FM_music(fm_url):printfm_url r = requests.get(fm_url, headers=header) FM_music_html = r.text track_list = re.findall(r'<div class="e-2304105070 text"><a.*?title="(.*?)".*?href="(.*?)">.*?</a>', FM_music_html,re.S) detail_info = []# 爬取一個FM下的每個音頻j =1foriintrack_list: detail = {}# 獲取爬取音頻所需的trackIdsid = str(i[1]).split('/')[3] detail['title'] = i[0] detail['detail_url'] = base_url + i[1] detail_info.append(detail)# api中的數(shù)據(jù)信息get_detailFM_api(id)printu'已獲取第'+ str(j) +u'個音頻'j +=1printdetail['title']+u',該音頻爬取完畢'time.sleep(2+random.randint(1,10))
獲取每個音頻對應(yīng)的url,這里需要注意侧啼,自我們點擊一個音頻的時候
這里寫圖片描述
進入到以下界面
這里寫圖片描述
我們既然要獲取音頻牛柒,那么不妨打開開發(fā)者工具,再點擊播放音頻試試
結(jié)果我們發(fā)現(xiàn)痊乾,點擊播放按鈕皮壁,發(fā)送了一個請求:
這里寫圖片描述
https://www.ximalaya.com/revision/play/tracks?trackIds=93433726
注意trackIds就是當(dāng)前音頻url的最后一部分:
https://www.ximalaya.com/youshengshu/11377428/93433726
同時我們可以看到我們所需的音頻源就在這里:
這里寫圖片描述
這里寫圖片描述
所以我們可以通過獲取頁面url的最后一部分,構(gòu)建一個請求哪审,發(fā)送后就可以獲取json數(shù)據(jù)蛾魄,從而獲得音頻源的url
第五步
defget_detailFM_api(id):api = base_api + idprintapi r = requests.get(api, headers=header) result = r.json() src = result['data']['tracksForAudioPlay'][0]ifsrc['src']:printu'試聽'r = requests.get(src['src'], headers=header)try: f = open('D:\\Python\\PycharmProject\\Enhance\\xmly_fm\\{}.m4a'.format(src['trackName']),'wb')except:printu'已存在'passf.write(r.content) f.closeprintu'保存完畢...'else:printu'需要收費'pass
通過訪問音頻源,以?r.content?將音頻保存到本地
這里寫圖片描述
這里保存的時候還需改進湿滓,希望做到對每個節(jié)目新建一個文件夾滴须,將該節(jié)目的音頻存入對應(yīng)的文件夾中
最后,程序從這里開始運行
if__name__=='__main__': getUrl()
有疑問或更好的方法的話叽奥,歡迎交流描馅!
下一篇應(yīng)該是爬取網(wǎng)易云的,或者是爬取視頻而线;最近也是忙著期末的考試铭污,我也算是碰見了最佩服的老師...(考試時看我們做的試卷,唉膀篮,急的直接說答案了`谀!...)
完整代碼可以在我的GitHub上下載~
https://github.com/joelYing/XimalayaFM
前前言
喜馬拉雅已經(jīng)更換標(biāo)簽誓竿,我重新更新了下代碼磅网,思路還是如此,需要的可以掃一下文末公眾號二維碼(本人會在上面發(fā)表爬蟲以及java的文章還有送書等資源福利哦)筷屡,也可以直接搜索公眾號“ 猿獅的單身日辰担”,好了廣告結(jié)束...
前言
之前寫過爬取圖片的一篇文章毙死,這回來看看如何爬取音頻燎潮。圖片,音頻扼倘,視頻這類都可以通過二進制方式保存到本地下載下來确封。
爬取圖片文章的鏈接:?python爬取圖片并以二進制方式保存到本地
目標(biāo)
本次我們爬取的目標(biāo)是--喜馬拉雅FM
這里寫圖片描述
喜馬拉雅FM有數(shù)不計的音頻,這些音頻都有自己的分類,所以進一步給自己拋出一個需求爪喘,?爬取喜馬拉雅所有分類的音頻
接下來我們來分析這些分類颜曾,找到所有分類?https://www.ximalaya.com/category/
這里寫圖片描述
我們可以看到這里包括了大量的分類,那么我們找一個分類來看看其內(nèi)部是怎樣的
這里寫圖片描述
這里我們可以看到文學(xué)類下面的諸多FM節(jié)目秉剑,那么點開節(jié)目泛豪,?有的需要充值,有的免費侦鹏,還有很多頁這樣的節(jié)目
這里寫圖片描述
繼續(xù)跟進候址,可以看到,我們需要爬取的音頻列表了种柑!
好了岗仑,所以現(xiàn)在目標(biāo)已經(jīng)清晰起來了: 找到所有分類 -> 對每一個分類,獲取其中所有頁的FM節(jié)目->對每一個FM節(jié)目聚请,爬取其下列表里的所有免費的音頻
開始動刀
第一步
代碼如下:
category_Url ='https://www.ximalaya.com/category/'base_url ='https://www.ximalaya.com'base_api ='https://www.ximalaya.com/revision/play/tracks?trackIds='header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36'}client = pymongo.MongoClient(host='localhost', port=27017)db = client['ximalaya']defgetUrl():r = requests.get(category_Url, headers=header) html = r.text result = re.findall(r'<a class="e-2880429693 item separator".*?href="(.*?)">(.*?)</a>', html, re.S) url_list = []foriinresult:# 以一個分類為例 - - 有聲書中的文學(xué)類荠雕,若沒有break 則可獲取全部分類second_url = base_url + i[0] url_list.append(second_url)# 獲取該分類中全部的頁數(shù)getMorePage(second_url)printsecond_urlbreak
分析每個分類的標(biāo)簽,獲取網(wǎng)頁源碼中的所有分類驶赏,這里的?category_Url?是上面提到的所有分類得界面的URL
還定義一些要用到的基本的炸卑,比如請求頭、連接MongoDB等煤傍, 在這里添加了break盖文,是因為音頻數(shù)過多,所以以有聲書為例
第二步
defgetMorePage(url):r = requests.get(url, headers=header) m_list_html = r.text pageNum = re.findall(r'(\d+)</span></a></li><li class="e-3793817119 page-next page-item">', m_list_html,re.S) pageNum = int(pageNum[0])# 循環(huán)獲取每一頁蚯姆,這里暫時獲取第一頁foriinrange(1, pageNum +1):ifi ==1: page_url = url# 獲取頁中的30個FMgetMusicList(page_url, i)else: page_url = url +'p{}/'.format(i) getMusicList(page_url, i)#爬取一頁break
進入一個分類后五续,可以看到很多頁的FM節(jié)目,所以應(yīng)該想辦法循環(huán)獲取頁面的內(nèi)容龄恋,這里我們發(fā)現(xiàn)?頁面數(shù)在網(wǎng)頁源碼中存在?疙驾,通過正則我們將其取出,然后循環(huán)
這里我們注意一下其頁面的url :
https://www.ximalaya.com/youshengshu/wenxue/p2/
后面的p2對應(yīng)頁數(shù)郭毕,而第一頁沒有p它碎,所以需要判斷,這里也同樣以第一頁為例
第三步
defgetMusicList(url, page):r = requests.get(url, headers=header) m_list_html = r.text result = re.findall(r'<a class="e-1889510108.*?href="(.*?)"><img.*?src="(.*?)".*?alt="(.*?)".*?/>.*?"e-1889510108 icon-earphone xuicon xuicon-erji"></i>(.*?)</span>.*?"e-2896848410 album-author".*?title="(.*?)">', m_list_html, re.S) info = []# 獲取該page中每一個FM的數(shù)據(jù)信息显押,可以存入MongoDBforiinresult: FM_info = {}#每個節(jié)目的urlFM_url = base_url + i[0]? FM_info['url'] = FM_url FM_info['picture'] = i[1] FM_info['name'] = i[2] FM_info['playback'] = i[3] FM_info['author'] = i[4] info.append(FM_info)# 獲取該FM中的音頻信息# os.mkdir('D:\\Python\\PycharmProject\\Enhance\\xmly_fm\\{}'.format(FM_info['name']))get_FM_music(FM_url)# 先獲取一個FM# for j in info:# print jtest = db['page'+ str(page)] test.insert(info)
以每頁的url為參數(shù)傳入?getMusicList()?獲取每一頁中的30個FM節(jié)目信息扳肛,可以將每個節(jié)目的信息存入到MongoDB中;然后是獲取每個節(jié)目中的音頻
第四步
defget_FM_music(fm_url):printfm_url r = requests.get(fm_url, headers=header) FM_music_html = r.text track_list = re.findall(r'<div class="e-2304105070 text"><a.*?title="(.*?)".*?href="(.*?)">.*?</a>', FM_music_html,re.S) detail_info = []# 爬取一個FM下的每個音頻j =1foriintrack_list: detail = {}# 獲取爬取音頻所需的trackIdsid = str(i[1]).split('/')[3] detail['title'] = i[0] detail['detail_url'] = base_url + i[1] detail_info.append(detail)# api中的數(shù)據(jù)信息get_detailFM_api(id)printu'已獲取第'+ str(j) +u'個音頻'j +=1printdetail['title']+u',該音頻爬取完畢'time.sleep(2+random.randint(1,10))
獲取每個音頻對應(yīng)的url乘碑,這里需要注意挖息,自我們點擊一個音頻的時候
這里寫圖片描述
進入到以下界面
這里寫圖片描述
我們既然要獲取音頻,那么不妨打開開發(fā)者工具蝉仇,再點擊播放音頻試試
結(jié)果我們發(fā)現(xiàn)旋讹,點擊播放按鈕殖蚕,發(fā)送了一個請求:
這里寫圖片描述
https://www.ximalaya.com/revision/play/tracks?trackIds=93433726
注意trackIds就是當(dāng)前音頻url的最后一部分:
https://www.ximalaya.com/youshengshu/11377428/93433726
同時我們可以看到我們所需的音頻源就在這里:
這里寫圖片描述
這里寫圖片描述
所以我們可以通過獲取頁面url的最后一部分轿衔,構(gòu)建一個請求沉迹,發(fā)送后就可以獲取json數(shù)據(jù),從而獲得音頻源的url
第五步
defget_detailFM_api(id):api = base_api + idprintapi r = requests.get(api, headers=header) result = r.json() src = result['data']['tracksForAudioPlay'][0]ifsrc['src']:printu'試聽'r = requests.get(src['src'], headers=header)try: f = open('D:\\Python\\PycharmProject\\Enhance\\xmly_fm\\{}.m4a'.format(src['trackName']),'wb')except:printu'已存在'passf.write(r.content) f.closeprintu'保存完畢...'else:printu'需要收費'pass
通過訪問音頻源害驹,以?r.content?將音頻保存到本地
這里寫圖片描述
這里保存的時候還需改進鞭呕,希望做到對每個節(jié)目新建一個文件夾,將該節(jié)目的音頻存入對應(yīng)的文件夾中
最后宛官,程序從這里開始運行
if__name__=='__main__': getUrl()
有疑問或更好的方法的話葫松,歡迎交流!
下一篇應(yīng)該是爬取網(wǎng)易云的羔砾,或者是爬取視頻腋寨;最近也是忙著期末的考試票摇,我也算是碰見了最佩服的老師...(考試時看我們做的試卷,唉珊擂,急的直接說答案了!费变!...)
完整代碼可以在我的GitHub上下載~
https://github.com/joelYing/XimalayaFM
前前言
喜馬拉雅已經(jīng)更換標(biāo)簽摧扇,我重新更新了下代碼,思路還是如此挚歧,需要的可以掃一下文末公眾號二維碼(本人會在上面發(fā)表爬蟲以及java的文章還有送書等資源福利哦)扛稽,也可以直接搜索公眾號“ 猿獅的單身日常”滑负,好了廣告結(jié)束...
前言
之前寫過爬取圖片的一篇文章在张,這回來看看如何爬取音頻。圖片矮慕,音頻瞧掺,視頻這類都可以通過二進制方式保存到本地下載下來。
爬取圖片文章的鏈接:?python爬取圖片并以二進制方式保存到本地
目標(biāo)
本次我們爬取的目標(biāo)是--喜馬拉雅FM
這里寫圖片描述
喜馬拉雅FM有數(shù)不計的音頻凡傅,這些音頻都有自己的分類辟狈,所以進一步給自己拋出一個需求,?爬取喜馬拉雅所有分類的音頻
接下來我們來分析這些分類夏跷,找到所有分類?https://www.ximalaya.com/category/
這里寫圖片描述
我們可以看到這里包括了大量的分類哼转,那么我們找一個分類來看看其內(nèi)部是怎樣的
這里寫圖片描述
這里我們可以看到文學(xué)類下面的諸多FM節(jié)目,那么點開節(jié)目槽华,?有的需要充值壹蔓,有的免費,還有很多頁這樣的節(jié)目
這里寫圖片描述
繼續(xù)跟進猫态,可以看到佣蓉,我們需要爬取的音頻列表了披摄!
好了,所以現(xiàn)在目標(biāo)已經(jīng)清晰起來了: 找到所有分類 -> 對每一個分類勇凭,獲取其中所有頁的FM節(jié)目->對每一個FM節(jié)目疚膊,爬取其下列表里的所有免費的音頻
開始動刀
第一步
代碼如下:
category_Url ='https://www.ximalaya.com/category/'base_url ='https://www.ximalaya.com'base_api ='https://www.ximalaya.com/revision/play/tracks?trackIds='header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36'}client = pymongo.MongoClient(host='localhost', port=27017)db = client['ximalaya']defgetUrl():r = requests.get(category_Url, headers=header) html = r.text result = re.findall(r'<a class="e-2880429693 item separator".*?href="(.*?)">(.*?)</a>', html, re.S) url_list = []foriinresult:# 以一個分類為例 - - 有聲書中的文學(xué)類,若沒有break 則可獲取全部分類second_url = base_url + i[0] url_list.append(second_url)# 獲取該分類中全部的頁數(shù)getMorePage(second_url)printsecond_urlbreak
分析每個分類的標(biāo)簽虾标,獲取網(wǎng)頁源碼中的所有分類寓盗,這里的?category_Url?是上面提到的所有分類得界面的URL
還定義一些要用到的基本的,比如請求頭璧函、連接MongoDB等傀蚌, 在這里添加了break,是因為音頻數(shù)過多蘸吓,所以以有聲書為例
第二步
defgetMorePage(url):r = requests.get(url, headers=header) m_list_html = r.text pageNum = re.findall(r'(\d+)</span></a></li><li class="e-3793817119 page-next page-item">', m_list_html,re.S) pageNum = int(pageNum[0])# 循環(huán)獲取每一頁善炫,這里暫時獲取第一頁foriinrange(1, pageNum +1):ifi ==1: page_url = url# 獲取頁中的30個FMgetMusicList(page_url, i)else: page_url = url +'p{}/'.format(i) getMusicList(page_url, i)#爬取一頁break
進入一個分類后,可以看到很多頁的FM節(jié)目库继,所以應(yīng)該想辦法循環(huán)獲取頁面的內(nèi)容箩艺,這里我們發(fā)現(xiàn)?頁面數(shù)在網(wǎng)頁源碼中存在?,通過正則我們將其取出制跟,然后循環(huán)
這里我們注意一下其頁面的url :
https://www.ximalaya.com/youshengshu/wenxue/p2/
后面的p2對應(yīng)頁數(shù)舅桩,而第一頁沒有p,所以需要判斷雨膨,這里也同樣以第一頁為例
第三步
defgetMusicList(url, page):r = requests.get(url, headers=header) m_list_html = r.text result = re.findall(r'<a class="e-1889510108.*?href="(.*?)"><img.*?src="(.*?)".*?alt="(.*?)".*?/>.*?"e-1889510108 icon-earphone xuicon xuicon-erji"></i>(.*?)</span>.*?"e-2896848410 album-author".*?title="(.*?)">', m_list_html, re.S) info = []# 獲取該page中每一個FM的數(shù)據(jù)信息擂涛,可以存入MongoDBforiinresult: FM_info = {}#每個節(jié)目的urlFM_url = base_url + i[0]? FM_info['url'] = FM_url FM_info['picture'] = i[1] FM_info['name'] = i[2] FM_info['playback'] = i[3] FM_info['author'] = i[4] info.append(FM_info)# 獲取該FM中的音頻信息# os.mkdir('D:\\Python\\PycharmProject\\Enhance\\xmly_fm\\{}'.format(FM_info['name']))get_FM_music(FM_url)# 先獲取一個FM# for j in info:# print jtest = db['page'+ str(page)] test.insert(info)
以每頁的url為參數(shù)傳入?getMusicList()?獲取每一頁中的30個FM節(jié)目信息,可以將每個節(jié)目的信息存入到MongoDB中聊记;然后是獲取每個節(jié)目中的音頻
第四步
defget_FM_music(fm_url):printfm_url r = requests.get(fm_url, headers=header) FM_music_html = r.text track_list = re.findall(r'<div class="e-2304105070 text"><a.*?title="(.*?)".*?href="(.*?)">.*?</a>', FM_music_html,re.S) detail_info = []# 爬取一個FM下的每個音頻j =1foriintrack_list: detail = {}# 獲取爬取音頻所需的trackIdsid = str(i[1]).split('/')[3] detail['title'] = i[0] detail['detail_url'] = base_url + i[1] detail_info.append(detail)# api中的數(shù)據(jù)信息get_detailFM_api(id)printu'已獲取第'+ str(j) +u'個音頻'j +=1printdetail['title']+u',該音頻爬取完畢'time.sleep(2+random.randint(1,10))
獲取每個音頻對應(yīng)的url撒妈,這里需要注意,自我們點擊一個音頻的時候
這里寫圖片描述
進入到以下界面
這里寫圖片描述
我們既然要獲取音頻排监,那么不妨打開開發(fā)者工具狰右,再點擊播放音頻試試
結(jié)果我們發(fā)現(xiàn),點擊播放按鈕舆床,發(fā)送了一個請求:
這里寫圖片描述
https://www.ximalaya.com/revision/play/tracks?trackIds=93433726
注意trackIds就是當(dāng)前音頻url的最后一部分:
https://www.ximalaya.com/youshengshu/11377428/93433726
同時我們可以看到我們所需的音頻源就在這里:
這里寫圖片描述
這里寫圖片描述
所以我們可以通過獲取頁面url的最后一部分棋蚌,構(gòu)建一個請求,發(fā)送后就可以獲取json數(shù)據(jù)挨队,從而獲得音頻源的url
第五步
defget_detailFM_api(id):api = base_api + idprintapi r = requests.get(api, headers=header) result = r.json() src = result['data']['tracksForAudioPlay'][0]ifsrc['src']:printu'試聽'r = requests.get(src['src'], headers=header)try: f = open('D:\\Python\\PycharmProject\\Enhance\\xmly_fm\\{}.m4a'.format(src['trackName']),'wb')except:printu'已存在'passf.write(r.content) f.closeprintu'保存完畢...'else:printu'需要收費'pass
通過訪問音頻源谷暮,以?r.content?將音頻保存到本地
這里寫圖片描述
這里保存的時候還需改進,希望做到對每個節(jié)目新建一個文件夾盛垦,將該節(jié)目的音頻存入對應(yīng)的文件夾中
最后湿弦,程序從這里開始運行
if__name__=='__main__': getUrl()
有疑問或更好的方法的話,歡迎交流腾夯!
小編準(zhǔn)備了一份2018年最新的python零基礎(chǔ)系統(tǒng)學(xué)習(xí)資料颊埃,需要學(xué)習(xí)資料加群735934841