【Python3】獲取個人蝦米歌單

最近想要在某網(wǎng)站上獲取無損音樂資源隘击,并通過自己的蝦米音樂歌單來搜索自己喜歡聽的歌曲名單

登錄前準(zhǔn)備

如下圖所示膏孟,首先找到登錄的POST請求(2處鹃锈,1處為掃碼登錄)窜醉,3處即為POST請求的URL宪萄,4處為參數(shù)設(shè)置,5處為返回值

image.png

接下來看看Params榨惰,看看POST請求需要提供哪些參數(shù)
image.png

1處2處即為蝦米的賬號和密碼拜英,3處為一個隨機參數(shù),
image.png

根據(jù)1處提供的URL地址琅催,獲取相應(yīng)cookies中的_xiamitoken參數(shù)

登錄前代碼

根據(jù)上面的分析居凶,在登錄前需要獲取_xiamitoken參數(shù),改代碼如下:

def login_pre():
    print('獲取_xiamitoken的值藤抡,為登錄必備參數(shù)')
    url = 'https://login.xiami.com/member/qrcodelogin'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    payload = {
        'lgToken':'7aac8d8dee47f354776a27d7af7cdeb2',
        'defaulturl':'https%3A%2F%2Fwww.xiami.com%2F',
        't':str(int(time()*1000)) # 時間隨機數(shù)
    }
    req = session.get(url=url,params=payload)
    # print(req)
    print(req.text)
    cookies = req.cookies
    _xiamitoken = cookies['_xiamitoken']
    # print(_xiamitoken)
    return _xiamitoken

登錄代碼

獲取參數(shù)_xiamitoken后即可進行登錄相關(guān)操作侠碧,代碼如下:

def login(_xiamitoken):
    print('登錄蝦米')
    url = 'https://login.xiami.com/passport/login'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
        'X-Requested-With':'XMLHttpRequest',
        'Content-Length':'164',
        'Connection':'keep-alive'
    }
    account = input('蝦米賬號:')
    pw = input('蝦米密碼:')
    payload = {
        '_xiamitoken':_xiamitoken,
        'done':'https%3A%2F%2Fwww.xiami.com',
        'verifycode':'',
        'account':account,
        'pw':pw,
        'submit':'登+錄'
    }
    req = session.post(url=url,data=payload,headers=headers)
    # print(req)
    print(req.text)

登陸后驗證

為了驗證是否登錄成功,可以獲取一下個人信息列表看看:

def login_after():
    print('登錄后個人信息')
    url = 'https://www.xiami.com/index/home'
    headers = {
        'Host':'www.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://www.xiami.com/',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    req = session.get(url=url,headers=headers)
    req = json.loads(req.text)
    # print('用戶信息:',req)
    nick_name = req['data']['userInfo']['nick_name']
    print('nick_name:',nick_name)

如果此處能夠正確打印個人用戶名缠黍,說明已經(jīng)登錄成功弄兜,接下來可以查看“我的音樂”列表了

歌單下載

點擊“我的音樂”獲取個人音樂列表。
步驟如下:

  • 首先瓷式,隨機選取某頁(1處)音樂的內(nèi)容替饿,并獲取最大列表頁數(shù)(2處
  • 其次,查看音樂列表的URL(3處)贸典,并搜索過濾出來(4處6處)视卢,
    image.png

    由上圖可見我們需要一個循環(huán)變量(pg_num)來表示頁數(shù)。
    然后我們需要獲取列表中的歌名(可以順帶獲取相應(yīng)的URL)和演唱者

方法一瓤漏,通過HTML標(biāo)簽獲取

image.png

通過觀察可知腾夯,這些歌單列表在<tbody>-><tr>-><td class="song_name">
image.png

方法二,通過正則表達式獲取

image.png

由上圖可知蔬充,歌名演唱者具有相同的結(jié)構(gòu)蝶俱,我們可以通過正則表達式獲取紅框中的內(nèi)容

pattern = re.compile('</span><a title=".*?".*?<a class="artist_name".*?</a>.*?</td>',re.S)
items = re.findall(pattern,text)

對象items即為本列所有歌單列表,再通過for循環(huán)即可逐步提取歌名演唱者

        for item in items:
            yield{
                'name':re.match('(.*)<a title="(.*?)"(.*?)',item).group(2),
                'href':re.match('(.*)href="(.*?)"(.*?)',item).group(2),
                'artist_name':re.search('(.*?)<a class="artist_name"(.*?)">(.*?)</a>.*>',item, re.S).group(3)
            }

yield即可在主函數(shù)中把該返回值當(dāng)中iterable進行讀取饥漫,完整代碼如下:

def lib_song():
    print('用戶歌單')
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0'
    }
    for pg_num in range(1,8):
        url = 'https://www.xiami.com/space/lib-song/u/13963315/page/{page_num}'.format(page_num=pg_num)
        req = session.get(url=url,headers=headers)
        print(req)
        text = req.text
        pattern = re.compile('</span><a title=".*?".*?<a class="artist_name".*?</a>.*?</td>',re.S)
        items = re.findall(pattern,text)
        # print(items)
        for item in items:
            yield{
                'name':re.match('(.*)<a title="(.*?)"(.*?)',item).group(2),
                'href':re.match('(.*)href="(.*?)"(.*?)',item).group(2),
                'artist_name':re.search('(.*?)<a class="artist_name"(.*?)">(.*?)</a>.*>',item, re.S).group(3)
            }

主函數(shù)代碼

if __name__ == '__main__':
    session = requests.session()
    _xiamitoken = login_pre()
    login(_xiamitoken)
    login_after()
    items = lib_song()
    # for item in items:
        # print(item)
    df = pd.DataFrame(items)
    df.to_csv('XiamiMusic.csv',encoding='utf-8_sig') # 通過encoding解決保存中文亂碼問題

lib_song的返回值是iterable對象榨呆,可用for循環(huán)逐個獲取

完整代碼

#!/usr/bin/env python3.6
# -*- coding: utf-8 -*-
'''
@author: Haffner2010
@contact: myprojtest@163.com
@Software: Pycharm + Python3.6
@OS:Windows 7 64 bit
@Site:http://www.reibang.com/u/e031670b216b
@file: XiamiMusic.py
@time: 2018/6/5 20:14
@desc:
'''

import requests
import re
import json
import pandas as pd
from time import time



def login_pre():
    print('獲取_xiamitoken的值,為登錄必備參數(shù)')
    url = 'https://login.xiami.com/member/qrcodelogin'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    payload = {
        'lgToken':'7aac8d8dee47f354776a27d7af7cdeb2',
        'defaulturl':'https%3A%2F%2Fwww.xiami.com%2F',
        't':str(int(time()*1000)) # 時間隨機數(shù)
    }
    req = session.get(url=url,params=payload)
    # print(req)
    print(req.text)
    cookies = req.cookies
    _xiamitoken = cookies['_xiamitoken']
    # print(_xiamitoken)
    return _xiamitoken


def login(_xiamitoken):
    print('登錄蝦米')
    url = 'https://login.xiami.com/passport/login'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
        'X-Requested-With':'XMLHttpRequest',
        'Content-Length':'164',
        'Connection':'keep-alive'
    }
    account = input('蝦米賬號:')
    pw = input('蝦米密碼:')
    payload = {
        '_xiamitoken':_xiamitoken,
        'done':'https%3A%2F%2Fwww.xiami.com',
        'verifycode':'',
        'account':account,
        'pw':pw,
        'submit':'登+錄'
    }
    req = session.post(url=url,data=payload,headers=headers)
    # print(req)
    print(req.text)
    
def login_after():
    print('登錄后個人信息')
    url = 'https://www.xiami.com/index/home'
    headers = {
        'Host':'www.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://www.xiami.com/',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    req = session.get(url=url,headers=headers)
    req = json.loads(req.text)
    # print('用戶信息:',req)
    nick_name = req['data']['userInfo']['nick_name']
    print('nick_name:',nick_name)


    
def lib_song():
    print('用戶歌單')
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0'
    }
    for pg_num in range(1,8):
        url = 'https://www.xiami.com/space/lib-song/u/13963315/page/{page_num}'.format(page_num=pg_num)
        req = session.get(url=url,headers=headers)
        print(req)
        text = req.text
        pattern = re.compile('</span><a title=".*?".*?<a class="artist_name".*?</a>.*?</td>',re.S)
        items = re.findall(pattern,text)
        # print(items)
        for item in items:
            yield{
                'name':re.match('(.*)<a title="(.*?)"(.*?)',item).group(2),
                'href':re.match('(.*)href="(.*?)"(.*?)',item).group(2),
                'artist_name':re.search('(.*?)<a class="artist_name"(.*?)">(.*?)</a>.*>',item, re.S).group(3)
            }


if __name__ == '__main__':
    session = requests.session()
    _xiamitoken = login_pre()
    login(_xiamitoken)
    login_after()
    items = lib_song()
    # for item in items:
        # print(item)
    df = pd.DataFrame(items)
    df.to_csv('XiamiMusic.csv',encoding='utf-8_sig') # 通過encoding解決保存中文亂碼問題

獲取的歌單保存在本地csv文件當(dāng)中庸队,下步將通過csv文件來搜索FLAC音樂資源

注意事項

文中的部分代碼有些需要完整的headers积蜻,有些只需要設(shè)置User-Agent即可,有些完全不需要headers彻消,可以通過不斷嘗試來判斷竿拆。

To be continued

有問題再補充

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市宾尚,隨后出現(xiàn)的幾起案子丙笋,更是在濱河造成了極大的恐慌谢澈,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件御板,死亡現(xiàn)場離奇詭異锥忿,居然都是意外死亡,警方通過查閱死者的電腦和手機怠肋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進店門敬鬓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人笙各,你說我怎么就攤上這事钉答。” “怎么了酪惭?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵希痴,是天一觀的道長。 經(jīng)常有香客問我春感,道長,這世上最難降的妖魔是什么虏缸? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任鲫懒,我火速辦了婚禮,結(jié)果婚禮上刽辙,老公的妹妹穿的比我還像新娘窥岩。我一直安慰自己,他們只是感情好宰缤,可當(dāng)我...
    茶點故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布颂翼。 她就那樣靜靜地躺著,像睡著了一般慨灭。 火紅的嫁衣襯著肌膚如雪朦乏。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天氧骤,我揣著相機與錄音呻疹,去河邊找鬼。 笑死筹陵,一個胖子當(dāng)著我的面吹牛刽锤,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播朦佩,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼并思,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了语稠?” 一聲冷哼從身側(cè)響起宋彼,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后宙暇,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體输枯,經(jīng)...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年占贫,在試婚紗的時候發(fā)現(xiàn)自己被綠了桃熄。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡型奥,死狀恐怖瞳收,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情厢汹,我是刑警寧澤螟深,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站烫葬,受9級特大地震影響界弧,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜搭综,卻給世界環(huán)境...
    茶點故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一垢箕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧兑巾,春花似錦条获、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至堂油,卻和暖如春修档,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背称诗。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工萍悴, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人寓免。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓癣诱,卻偏偏與公主長得像,于是被迫代替她去往敵國和親袜香。 傳聞我的和親對象是個殘疾皇子撕予,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內(nèi)容