Python采集彼岸4K高清壁紙

前言

嗨嘍，大家好呀~這里是愛看美女的茜茜吶

又到了學(xué)Python時(shí)刻~

環(huán)境使用:

Python 3.8 解釋器
Pycharm 編輯器

模塊

import re
import requests >>> pip install requests

模塊安裝問題:

如果安裝python第三方模塊:
1. win + R 輸入 cmd 點(diǎn)擊確定, 輸入安裝命令 pip install 模塊名 (pip install requests) 回車
2. 在pycharm中點(diǎn)擊Terminal(終端) 輸入安裝命令
安裝失敗原因:
- 失敗一: pip 不是內(nèi)部命令
  
  解決方法: 設(shè)置環(huán)境變量
- 失敗二: 出現(xiàn)大量報(bào)紅 (read time out)
  
  解決方法: 因?yàn)槭蔷W(wǎng)絡(luò)鏈接超時(shí), 需要切換鏡像源
```
    清華：https://pypi.tuna.tsinghua.edu.cn/simple
    阿里云：https://mirrors.aliyun.com/pypi/simple/
    中國科技大學(xué) https://pypi.mirrors.ustc.edu.cn/simple/
    華中理工大學(xué)：https://pypi.hustunique.com/
    山東理工大學(xué)：https://pypi.sdutlinux.org/
    豆瓣：https://pypi.douban.com/simple/
    例如：pip3 install -i https://pypi.doubanio.com/simple/ 模塊名
```
- 失敗三: cmd里面顯示已經(jīng)安裝過了, 或者安裝成功了, 但是在pycharm里面還是無法導(dǎo)入
  
  解決方法: 可能安裝了多個(gè)python版本 (anaconda 或者 python 安裝一個(gè)即可) 卸載一個(gè)就好
  或者你pycharm里面python解釋器沒有設(shè)置好

思路

image

代碼展示

導(dǎo)入模塊

# 導(dǎo)入數(shù)據(jù)請(qǐng)求模塊 --> 第三方模塊, 需要安裝 pip install requests
import requests
# 導(dǎo)入正則模塊 --> 內(nèi)置模塊, 不需要安裝
import re

"""

發(fā)送請(qǐng)求, 模擬瀏覽器對(duì)于url地址發(fā)送請(qǐng)求
- 模擬瀏覽器 <反爬處理> 請(qǐng)求頭 <字典數(shù)據(jù)類型>
  如果你不偽裝, 可能會(huì)被識(shí)別出來是爬蟲程序, 從而得到數(shù)據(jù)內(nèi)容
  可以直接復(fù)制粘貼 --> 開發(fā)者工具里面就可以復(fù)制
- <Response [200]> 響應(yīng)對(duì)象
  Response: 中文意思-->響應(yīng)
  <>: 表示對(duì)象
  200: 狀態(tài)碼表示請(qǐng)求成功
發(fā)送請(qǐng)求, 請(qǐng)求成功了

image

"""

for page in range(2, 11):
    print(f'=================正在采集第{page}頁的數(shù)據(jù)內(nèi)容=================')

請(qǐng)求圖片目錄頁面url

    url = f'http://www.****.com/dongman/index_{page}.htm'

偽裝模擬成瀏覽器

    headers = {
        # User-Agent 用戶代理 瀏覽器基本身份信息
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
    }

發(fā)送請(qǐng)求

調(diào)用requests模塊里面get請(qǐng)求方法, 對(duì)于url地址發(fā)送請(qǐng)求, 并且攜帶上headers請(qǐng)求頭偽裝, 最后用自定義變量名response接受返回的數(shù)據(jù)

    response = requests.get(url=url, headers=headers)

"""

獲取數(shù)據(jù), 獲取服務(wù)器返回響應(yīng)數(shù)據(jù)

response 網(wǎng)頁源代碼

response.text 獲取響應(yīng)文本數(shù)據(jù) <網(wǎng)頁源代碼>
解析數(shù)據(jù), 提取我們想要的數(shù)據(jù)內(nèi)容
- 圖片ID
正則表達(dá)式Re

調(diào)用re模塊里面findall方法 --> 找到所有我們想要的數(shù)據(jù)

re.findall('找什么數(shù)據(jù)', '從哪里找') --> 從什么地方, 去匹配找什么樣的數(shù)據(jù)內(nèi)容

從 response.text<網(wǎng)頁源代碼> 里面去找 <a href="/desk/(\d+).htm" 其中 (\d+) 就是我們要的內(nèi)容

\d+ 表示任意數(shù)字

"""

提取圖片ID --> 列表 <盒子/箱子> '29381' 是列表<箱子>里面元素<蘋果>

    img_id_list = re.findall('<a href="/desk/(\d+).htm"', response.text)

for循環(huán)遍歷, 把列表里面元素一個(gè)一個(gè)提取出來

    for img_id in img_id_list:
        # img_id變量<袋子> 給 img_id_list 列表<盒子> 里面 元素<蘋果> 給裝起來
        print(img_id)

"""

發(fā)送請(qǐng)求, 模擬瀏覽器對(duì)于url地址發(fā)送請(qǐng)求

請(qǐng)求圖片詳情頁頁面url http://www.****.com/desk/{圖片ID}.htm

獲取數(shù)據(jù), 獲取服務(wù)器返回響應(yīng)數(shù)據(jù)

response 網(wǎng)頁源代碼

"""
請(qǐng)求詳情頁鏈接 --> f'{img_id}' 字符串格式化方法

        link = f'http://www.*****.com/desk/{img_id}.htm'

發(fā)送請(qǐng)求

        response_1 = requests.get(url=link, headers=headers)

獲取數(shù)據(jù)內(nèi)容網(wǎng)頁源代碼 ---> 亂碼了, 進(jìn)行轉(zhuǎn)碼

        response_1.encoding = 'gbk'

解析數(shù)據(jù), 提取我們想要的數(shù)據(jù)內(nèi)容<圖片鏈接/圖片標(biāo)題>

        img_url, img_title = re.findall('<img src="(.*?)" alt="(.*?)"', response_1.text)[0]

保存數(shù)據(jù) --> 先獲取圖片數(shù)據(jù)內(nèi)容

        img_content = requests.get(url=img_url, headers=headers).content
        with open('img\\' + img_title + '.jpg', mode='wb') as f:
            f.write(img_content)
        print(img_url, img_title)

效果

尾語

感謝你觀看我的文章吶~本次航班到這里就結(jié)束啦 ??

希望本篇文章有對(duì)你帶來幫助 ??关面，有學(xué)習(xí)到一點(diǎn)知識(shí)~

躲起來的星星??也在努力發(fā)光活孩，你也要努力加油（讓我們一起努力叭）太示。

最后編輯于：2023.01.12 16:50:50

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末控轿，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子财饥，更是在濱河造成了極大的恐慌墩衙，老刑警劉巖务嫡，帶你破解...
沈念sama閱讀 207,113評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異漆改，居然都是意外死亡心铃，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,644評(píng)論 2贊 381
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門籽懦，熙熙樓的掌柜王于貴愁眉苦臉地迎上來于个，“玉大人，你說我怎么就攤上這事暮顺√ǎ” “怎么了？”我有些...
開封第一講書人閱讀 153,340評(píng)論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵捶码，是天一觀的道長羽氮。經(jīng)常有香客問我，道長惫恼，這世上最難降的妖魔是什么档押？我笑而不...
開封第一講書人閱讀 55,449評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮祈纯，結(jié)果婚禮上令宿，老公的妹妹穿的比我還像新娘。我一直安慰自己腕窥，他們只是感情好粒没，可當(dāng)我...
茶點(diǎn)故事閱讀 64,445評(píng)論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著簇爆，像睡著了一般癞松。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上入蛆，一...
開封第一講書人閱讀 49,166評(píng)論 1贊 284
城市分裂傳說
那天响蓉，我揣著相機(jī)與錄音，去河邊找鬼哨毁。笑死枫甲，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播言秸，決...
沈念sama閱讀 38,442評(píng)論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼软能，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了举畸？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,105評(píng)論 0贊 261
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤凳枝，失蹤者是張志新（化名）和其女友劉穎抄沮，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體岖瑰，經(jīng)...
沈念sama閱讀 43,601評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡叛买，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,066評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蹋订。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片率挣。...
茶點(diǎn)故事閱讀 38,161評(píng)論 1贊 334
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖露戒，靈堂內(nèi)的尸體忽然破棺而出椒功，到底是詐尸還是另有隱情，我是刑警寧澤智什，帶...
沈念sama閱讀 33,792評(píng)論 4贊 323
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布动漾，位于F島的核電站，受9級(jí)特大地震影響荠锭，放射性物質(zhì)發(fā)生泄漏旱眯。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,351評(píng)論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一证九、第九天我趴在偏房一處隱蔽的房頂上張望删豺。院中可真熱鬧，春花似錦愧怜、人聲如沸呀页。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,352評(píng)論 0贊 19
一樁弒父案叫搁，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽赔桌。三九已至，卻和暖如春渴逻，著一層夾襖步出監(jiān)牢的瞬間疾党，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,584評(píng)論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工惨奕，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留雪位，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,618評(píng)論 2贊 355
代替公主和親
正文我出身青樓梨撞，卻偏偏與公主長得像雹洗，于是被迫代替她去往敵國和親香罐。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,916評(píng)論 2贊 344

Python采集彼岸4K高清壁紙

前言

環(huán)境使用:

思路

代碼展示

效果

尾語

推薦閱讀更多精彩內(nèi)容