王者榮耀爬蟲(爬取每個英雄的皮膚圖片)


前言

  • 抓取的重點是找到每個英雄對應的id編號




分析




接下來找英雄對應的id編號

代碼

import requests
import re
import json
import os
import time

# 獲取當前時間戳揍移,用于計算爬蟲爬取完畢消耗了多少時間
now = lambda: time.time()

# 請求頭
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
    "Cookie": "pgv_pvid=120529985; pgv_pvi=8147644416; RK=iSx1Z7fSHW; ptcz=d094d0d03f513f6762a4c18a13ddae168782ec153f43b16b604723b27069d0a7; luin=o0894028891; lskey=000100008bc32936da345e2a5268733bf022b5be1613bd2600c10ad315c7559ff138e170f30e0dcd6a325a38; tvfe_boss_uuid=8f47030b9d8237f7; o_cookie=894028891; LW_sid=s116T01788a5f6T2U8I0j4F1K8; LW_uid=Z1q620M7a8E5G6b2m8p0R4U280; eas_sid=m1j6R057x88566P2Z8k074T2N7; eas_entry=https%3A%2F%2Fcn.bing.com%2F; pgv_si=s8425377792; PTTuserFirstTime=1607817600000; isHostDate=18609; isOsSysDate=18609; PTTosSysFirstTime=1607817600000; isOsDate=18609; PTTosFirstTime=1607817600000; pgv_info=ssid=s5339727114; ts_refer=cn.bing.com/; ts_uid=120529985; weekloop=0-0-0-51; ieg_ingame_userid=Qh3nEjEJwxHvg8utb4rT2AJKkM0fsWng; pvpqqcomrouteLine=index_herolist_herolist_herodetail_herodetail_herodetail_herodetail; ts_last=pvp.qq.com/web201605/herolist.shtml; PTTDate=1607856398243",
    "referer": "https://pvp.qq.com/"
}

# 解析函數(shù)次和,返回文本或者二進制或者None
def parse_url(url, get_b=False):
    try:
        response = requests.get(url, headers=headers)
        response.encoding = "gbk"
        assert response.status_code == 200
        if get_b == True:
            return response.content
        else:
            return response.text
    except:
        print("status_code != 200(from parse_url)")
        return None

# 處理單個英雄
def parse_hero_detail(id, name):
    # 保存所有皮膚圖片的本地路徑
    path = f"./英雄皮膚/{name}"
    if not os.path.exists(path):
        os.makedirs(path, exist_ok=True)

    # 因為不確定每個英雄有多少個皮膚,所以假設單個英雄一共請求10張皮膚那伐,這樣就不會出現(xiàn)皮膚缺少的情況
    for num in range(1, 11):
        # 單個英雄皮膚圖片的url鏈接
        api_url = f"https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{id}/{id}-bigskin-{num}.jpg"

        # 如果返回None踏施,則說明狀態(tài)碼不是200,即沒有這個請求的皮膚
        b_data = parse_url(api_url, get_b=True)

        if b_data == None:
            print(f"{name} 一共有{num - 1}個皮膚")
            print("--------------------------------------------------")
            # 沒有新的皮膚了罕邀,立即退出循環(huán)
            break

        img_path = f"{path}/demo{num}.jpg"
        if not os.path.exists(img_path):
            try:
                download_img(img_path, b_data)
            except:
                return
            print(f"{name} 第{num}張皮膚圖片 下載完畢")

# 下載圖片
def download_img(path, b_data):
    with open(path, "wb") as f:
        f.write(b_data)


def main():
    # 含有每個英雄對應的id畅形、英雄名稱的url
    api_url = "https://game.gtimg.cn/images/yxzj/web201706/js/heroid.js"
    text = parse_url(api_url)

    search_result = re.search('var module_exports = ({.*?})', text, re.S)
    hero_info_str = search_result.group(1)
    hero_info_str = re.sub("'", '"', hero_info_str)
    # 包含 所有英雄以及各自對應的id 的字典
    hero_info_dict = json.loads(hero_info_str)

    for hero in hero_info_dict:
        name, id = hero_info_dict[hero], hero
        print(name, id)
        parse_hero_detail(id, name)


if __name__ == '__main__':
    start = now()                       # 記錄起始時間
    main()                              # 主函數(shù)
    print(f"耗時: {now() - start}")     # 計算爬蟲執(zhí)行完畢消耗的時間



運行演示

在這里插入圖片描述


爬蟲運行完畢結果展示(部分)

在這里插入圖片描述


補充

  • 艾琳是空的,你們懂的
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末诉探,一起剝皮案震驚了整個濱河市日熬,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌阵具,老刑警劉巖碍遍,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異阳液,居然都是意外死亡怕敬,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進店門帘皿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來东跪,“玉大人,你說我怎么就攤上這事∷涮睿” “怎么了丁恭?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長斋日。 經(jīng)常有香客問我牲览,道長,這世上最難降的妖魔是什么恶守? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任第献,我火速辦了婚禮,結果婚禮上兔港,老公的妹妹穿的比我還像新娘庸毫。我一直安慰自己,他們只是感情好衫樊,可當我...
    茶點故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布飒赃。 她就那樣靜靜地躺著,像睡著了一般科侈。 火紅的嫁衣襯著肌膚如雪载佳。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天兑徘,我揣著相機與錄音刚盈,去河邊找鬼。 笑死挂脑,一個胖子當著我的面吹牛藕漱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播崭闲,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼肋联,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了刁俭?” 一聲冷哼從身側響起橄仍,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎牍戚,沒想到半個月后侮繁,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡如孝,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年宪哩,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片第晰。...
    茶點故事閱讀 38,100評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡锁孟,死狀恐怖彬祖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情品抽,我是刑警寧澤储笑,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站圆恤,受9級特大地震影響突倍,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜哑了,卻給世界環(huán)境...
    茶點故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一赘方、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧弱左,春花似錦、人聲如沸炕淮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽涂圆。三九已至们镜,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間润歉,已是汗流浹背模狭。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留踩衩,地道東北人嚼鹉。 一個月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像驱富,于是被迫代替她去往敵國和親锚赤。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,834評論 2 345

推薦閱讀更多精彩內(nèi)容