【Python3】獲取個人蝦米歌單

最近想要在某網(wǎng)站上獲取無損音樂資源隘击，并通過自己的蝦米音樂歌單來搜索自己喜歡聽的歌曲名單

登錄前準(zhǔn)備

如下圖所示膏孟，首先找到登錄的POST請求（2處鹃锈，1處為掃碼登錄）窜醉，3處即為POST請求的URL宪萄，4處為參數(shù)設(shè)置，5處為返回值

image.png

接下來看看Params榨惰，看看POST請求需要提供哪些參數(shù)

image.png

1處和2處即為蝦米的賬號和密碼拜英，3處為一個隨機參數(shù)，

image.png

根據(jù)1處提供的URL地址琅催，獲取相應(yīng)cookies中的_xiamitoken參數(shù)

登錄前代碼

根據(jù)上面的分析居凶，在登錄前需要獲取_xiamitoken參數(shù)，改代碼如下：

def login_pre():
    print('獲取_xiamitoken的值藤抡，為登錄必備參數(shù)')
    url = 'https://login.xiami.com/member/qrcodelogin'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    payload = {
        'lgToken':'7aac8d8dee47f354776a27d7af7cdeb2',
        'defaulturl':'https%3A%2F%2Fwww.xiami.com%2F',
        't':str(int(time()*1000)) # 時間隨機數(shù)
    }
    req = session.get(url=url,params=payload)
    # print(req)
    print(req.text)
    cookies = req.cookies
    _xiamitoken = cookies['_xiamitoken']
    # print(_xiamitoken)
    return _xiamitoken

登錄代碼

獲取參數(shù)_xiamitoken后即可進行登錄相關(guān)操作侠碧，代碼如下：

def login(_xiamitoken):
    print('登錄蝦米')
    url = 'https://login.xiami.com/passport/login'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
        'X-Requested-With':'XMLHttpRequest',
        'Content-Length':'164',
        'Connection':'keep-alive'
    }
    account = input('蝦米賬號：')
    pw = input('蝦米密碼：')
    payload = {
        '_xiamitoken':_xiamitoken,
        'done':'https%3A%2F%2Fwww.xiami.com',
        'verifycode':'',
        'account':account,
        'pw':pw,
        'submit':'登+錄'
    }
    req = session.post(url=url,data=payload,headers=headers)
    # print(req)
    print(req.text)

登陸后驗證

為了驗證是否登錄成功，可以獲取一下個人信息列表看看：

def login_after():
    print('登錄后個人信息')
    url = 'https://www.xiami.com/index/home'
    headers = {
        'Host':'www.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://www.xiami.com/',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    req = session.get(url=url,headers=headers)
    req = json.loads(req.text)
    # print('用戶信息：',req)
    nick_name = req['data']['userInfo']['nick_name']
    print('nick_name:',nick_name)

如果此處能夠正確打印個人用戶名缠黍，說明已經(jīng)登錄成功弄兜，接下來可以查看“我的音樂”列表了

歌單下載

點擊“我的音樂”獲取個人音樂列表。
步驟如下：

首先瓷式，隨機選取某頁（1處）音樂的內(nèi)容替饿，并獲取最大列表頁數(shù)（2處）
其次，查看音樂列表的URL（3處）贸典，并搜索過濾出來（4處至6處）视卢，

image.png

由上圖可見我們需要一個循環(huán)變量（pg_num）來表示頁數(shù)。
然后我們需要獲取列表中的歌名（可以順帶獲取相應(yīng)的URL）和演唱者

方法一瓤漏，通過HTML標(biāo)簽獲取

image.png

通過觀察可知腾夯，這些歌單列表在<tbody>-><tr>-><td class="song_name">下

image.png

方法二，通過正則表達式獲取

image.png

由上圖可知蔬充，歌名和演唱者具有相同的結(jié)構(gòu)蝶俱，我們可以通過正則表達式獲取紅框中的內(nèi)容

pattern = re.compile('</span><a title=".*?".*?<a class="artist_name".*?</a>.*?</td>',re.S)
items = re.findall(pattern,text)

對象items即為本列所有歌單列表，再通過for循環(huán)即可逐步提取歌名和演唱者：

        for item in items:
            yield{
                'name':re.match('(.*)<a title="(.*?)"(.*?)',item).group(2),
                'href':re.match('(.*)href="(.*?)"(.*?)',item).group(2),
                'artist_name':re.search('(.*?)<a class="artist_name"(.*?)">(.*?)</a>.*>',item, re.S).group(3)
            }

用yield即可在主函數(shù)中把該返回值當(dāng)中iterable進行讀取饥漫，完整代碼如下：

def lib_song():
    print('用戶歌單')
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0'
    }
    for pg_num in range(1,8):
        url = 'https://www.xiami.com/space/lib-song/u/13963315/page/{page_num}'.format(page_num=pg_num)
        req = session.get(url=url,headers=headers)
        print(req)
        text = req.text
        pattern = re.compile('</span><a title=".*?".*?<a class="artist_name".*?</a>.*?</td>',re.S)
        items = re.findall(pattern,text)
        # print(items)
        for item in items:
            yield{
                'name':re.match('(.*)<a title="(.*?)"(.*?)',item).group(2),
                'href':re.match('(.*)href="(.*?)"(.*?)',item).group(2),
                'artist_name':re.search('(.*?)<a class="artist_name"(.*?)">(.*?)</a>.*>',item, re.S).group(3)
            }

主函數(shù)代碼

if __name__ == '__main__':
    session = requests.session()
    _xiamitoken = login_pre()
    login(_xiamitoken)
    login_after()
    items = lib_song()
    # for item in items:
        # print(item)
    df = pd.DataFrame(items)
    df.to_csv('XiamiMusic.csv',encoding='utf-8_sig') # 通過encoding解決保存中文亂碼問題

lib_song的返回值是iterable對象榨呆，可用for循環(huán)逐個獲取

完整代碼

#!/usr/bin/env python3.6
# -*- coding: utf-8 -*-
'''
@author: Haffner2010
@contact: myprojtest@163.com
@Software: Pycharm + Python3.6
@OS:Windows 7 64 bit
@Site:http://www.reibang.com/u/e031670b216b
@file: XiamiMusic.py
@time: 2018/6/5 20:14
@desc:
'''

import requests
import re
import json
import pandas as pd
from time import time



def login_pre():
    print('獲取_xiamitoken的值，為登錄必備參數(shù)')
    url = 'https://login.xiami.com/member/qrcodelogin'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    payload = {
        'lgToken':'7aac8d8dee47f354776a27d7af7cdeb2',
        'defaulturl':'https%3A%2F%2Fwww.xiami.com%2F',
        't':str(int(time()*1000)) # 時間隨機數(shù)
    }
    req = session.get(url=url,params=payload)
    # print(req)
    print(req.text)
    cookies = req.cookies
    _xiamitoken = cookies['_xiamitoken']
    # print(_xiamitoken)
    return _xiamitoken


def login(_xiamitoken):
    print('登錄蝦米')
    url = 'https://login.xiami.com/passport/login'
    headers = {
        'Host':'login.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://login.xiami.com/member/login',
        'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
        'X-Requested-With':'XMLHttpRequest',
        'Content-Length':'164',
        'Connection':'keep-alive'
    }
    account = input('蝦米賬號：')
    pw = input('蝦米密碼：')
    payload = {
        '_xiamitoken':_xiamitoken,
        'done':'https%3A%2F%2Fwww.xiami.com',
        'verifycode':'',
        'account':account,
        'pw':pw,
        'submit':'登+錄'
    }
    req = session.post(url=url,data=payload,headers=headers)
    # print(req)
    print(req.text)
    
def login_after():
    print('登錄后個人信息')
    url = 'https://www.xiami.com/index/home'
    headers = {
        'Host':'www.xiami.com',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Language':'zh-CN,en-US;q=0.7,en;q=0.3',
        'Accept-Encoding':'gzip, deflate, br',
        'Referer':'https://www.xiami.com/',
        'X-Requested-With':'XMLHttpRequest',
        'Connection':'keep-alive'
    }
    req = session.get(url=url,headers=headers)
    req = json.loads(req.text)
    # print('用戶信息：',req)
    nick_name = req['data']['userInfo']['nick_name']
    print('nick_name:',nick_name)


    
def lib_song():
    print('用戶歌單')
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0'
    }
    for pg_num in range(1,8):
        url = 'https://www.xiami.com/space/lib-song/u/13963315/page/{page_num}'.format(page_num=pg_num)
        req = session.get(url=url,headers=headers)
        print(req)
        text = req.text
        pattern = re.compile('</span><a title=".*?".*?<a class="artist_name".*?</a>.*?</td>',re.S)
        items = re.findall(pattern,text)
        # print(items)
        for item in items:
            yield{
                'name':re.match('(.*)<a title="(.*?)"(.*?)',item).group(2),
                'href':re.match('(.*)href="(.*?)"(.*?)',item).group(2),
                'artist_name':re.search('(.*?)<a class="artist_name"(.*?)">(.*?)</a>.*>',item, re.S).group(3)
            }


if __name__ == '__main__':
    session = requests.session()
    _xiamitoken = login_pre()
    login(_xiamitoken)
    login_after()
    items = lib_song()
    # for item in items:
        # print(item)
    df = pd.DataFrame(items)
    df.to_csv('XiamiMusic.csv',encoding='utf-8_sig') # 通過encoding解決保存中文亂碼問題

獲取的歌單保存在本地csv文件當(dāng)中庸队，下步將通過csv文件來搜索FLAC音樂資源

注意事項

文中的部分代碼有些需要完整的headers积蜻，有些只需要設(shè)置User-Agent即可，有些完全不需要headers彻消，可以通過不斷嘗試來判斷竿拆。

To be continued

有問題再補充

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市宾尚，隨后出現(xiàn)的幾起案子丙笋，更是在濱河造成了極大的恐慌谢澈，老刑警劉巖，帶你破解...
沈念sama閱讀 222,627評論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件御板，死亡現(xiàn)場離奇詭異锥忿，居然都是意外死亡，警方通過查閱死者的電腦和手機怠肋，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,180評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門敬鬓，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人笙各，你說我怎么就攤上這事钉答。” “怎么了酪惭？”我有些...
開封第一講書人閱讀 169,346評論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵希痴，是天一觀的道長。經(jīng)常有香客問我春感，道長，這世上最難降的妖魔是什么虏缸？我笑而不...
開封第一講書人閱讀 60,097評論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任鲫懒，我火速辦了婚禮，結(jié)果婚禮上刽辙，老公的妹妹穿的比我還像新娘窥岩。我一直安慰自己，他們只是感情好宰缤，可當(dāng)我...
茶點故事閱讀 69,100評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布颂翼。她就那樣靜靜地躺著，像睡著了一般慨灭。火紅的嫁衣襯著肌膚如雪朦乏。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,696評論 1贊 312
城市分裂傳說
那天氧骤，我揣著相機與錄音呻疹，去河邊找鬼。笑死筹陵，一個胖子當(dāng)著我的面吹牛刽锤，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播朦佩，決...
沈念sama閱讀 41,165評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼并思，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了语稠？” 一聲冷哼從身側(cè)響起宋彼，我...
開封第一講書人閱讀 40,108評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后宙暇，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體输枯，經(jīng)...
沈念sama閱讀 46,646評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,709評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年占贫，在試婚紗的時候發(fā)現(xiàn)自己被綠了桃熄。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,861評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡型奥，死狀恐怖瞳收，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情厢汹，我是刑警寧澤螟深，帶...
沈念sama閱讀 36,527評論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站烫葬，受9級特大地震影響界弧，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜搭综，卻給世界環(huán)境...
茶點故事閱讀 42,196評論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一垢箕、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧兑巾，春花似錦条获、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,698評論 0贊 25
一樁弒父案帅掘，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至堂油，卻和暖如春修档，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背称诗。一陣腳步聲響...
開封第一講書人閱讀 33,804評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工萍悴，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人寓免。一個月前我還...
沈念sama閱讀 49,287評論 3贊 379
代替公主和親
正文我出身青樓癣诱，卻偏偏與公主長得像，于是被迫代替她去往敵國和親袜香。傳聞我的和親對象是個殘疾皇子撕予，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,860評論 2贊 361

【Python3】獲取個人蝦米歌單

登錄前準(zhǔn)備

登錄前代碼

登錄代碼

登陸后驗證

歌單下載

方法一瓤漏，通過HTML標(biāo)簽獲取

方法二，通過正則表達式獲取

主函數(shù)代碼

完整代碼

注意事項

To be continued

推薦閱讀更多精彩內(nèi)容