單線程爬取彼岸桌面美女壁紙

爬蟲未加入多線程,有興趣研究的可以深入了解
其實用Scrapy爬取效率更高,代碼更少.這個腳本需要第三方庫requests和BeautifulSoup4

腳本未做優(yōu)化或試錯

捕獲.PNG
import requests
from bs4 import BeautifulSoup
import os

url = 'http://www.netbian.com/meinv/'
path = './美女壁紙/'


def get_html(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
    try:
        res = requests.get(url, headers=headers)
        if res.ok:
            res.encoding = res.apparent_encoding
            return res.text
        return None
    except:
        print('訪問出錯!!')


def get_img_url(url=url):
    html = get_html(url)
    if html:
        soup = BeautifulSoup(html, 'html.parser')
        links = soup.select("div.list b a[href*=.htm]")
        for link in links:
            url = link.get('href').replace('.htm', '-1920x1080.htm').replace('/desk', 'http://www.netbian.com/desk')
            get_wallpage(url)
        prev = soup.select('div.page > a.prev')
        for a in prev:
            if "下一頁" in a.text:
                next_page = 'http://www.netbian.com' + a.get('href')
                print('獲取下一頁' + next_page)
        get_img_url(next_page)


def get_wallpage(url):
    html = get_html(url)
    if html:
        soup = BeautifulSoup(html, 'html.parser')
        if soup.select("img[title]"):
            link = soup.select("img[title]")[0]
            title = link.get('title')
            src = link.get('src')
            save_wallpage(title, src)


def save_wallpage(name, src):
    global path
    image = requests.get(src)
    if image.ok:
        print('正在保存...' + name)
        with open(path + name + '.jpg', 'wb') as f:
            f.write(image.content)


get_img_url()


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市典唇,隨后出現(xiàn)的幾起案子镊折,更是在濱河造成了極大的恐慌,老刑警劉巖蚓聘,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件腌乡,死亡現(xiàn)場離奇詭異,居然都是意外死亡夜牡,警方通過查閱死者的電腦和手機与纽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進店門侣签,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人急迂,你說我怎么就攤上這事影所。” “怎么了僚碎?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵猴娩,是天一觀的道長。 經(jīng)常有香客問我勺阐,道長卷中,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任渊抽,我火速辦了婚禮蟆豫,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘懒闷。我一直安慰自己十减,他們只是感情好,可當我...
    茶點故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布愤估。 她就那樣靜靜地躺著帮辟,像睡著了一般。 火紅的嫁衣襯著肌膚如雪玩焰。 梳的紋絲不亂的頭發(fā)上由驹,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天,我揣著相機與錄音震捣,去河邊找鬼荔棉。 笑死,一個胖子當著我的面吹牛蒿赢,可吹牛的內(nèi)容都是我干的润樱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼羡棵,長吁一口氣:“原來是場噩夢啊……” “哼壹若!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起皂冰,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤店展,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后秃流,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體赂蕴,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年舶胀,在試婚紗的時候發(fā)現(xiàn)自己被綠了概说。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碧注。...
    茶點故事閱讀 39,834評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖糖赔,靈堂內(nèi)的尸體忽然破棺而出萍丐,到底是詐尸還是另有隱情,我是刑警寧澤放典,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布逝变,位于F島的核電站,受9級特大地震影響奋构,放射性物質(zhì)發(fā)生泄漏壳影。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一声怔、第九天 我趴在偏房一處隱蔽的房頂上張望态贤。 院中可真熱鬧舱呻,春花似錦醋火、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至茬高,卻和暖如春兆旬,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背怎栽。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工丽猬, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人熏瞄。 一個月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓脚祟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親强饮。 傳聞我的和親對象是個殘疾皇子由桌,可洞房花燭夜當晚...
    茶點故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 爬蟲文章 in 簡書程序員專題: like:128-Python 爬取落網(wǎng)音樂 like:127-【圖文詳解】py...
    喜歡吃栗子閱讀 21,752評論 4 412
  • 爬蟲文章 in 簡書程序員專題: like:128 - Python 爬取落網(wǎng)音樂 like:127 - 【圖文詳...
    treelake閱讀 29,551評論 33 638
  • 當你站在了一個高度,俯視腳下的萬事萬物邮丰,不管你背后有不有更高的山峰行您,你只顧享受眼前的一覽眾山小的虛榮,...
    烽火煤閱讀 129評論 0 0
  • 透明的氣泡 如何在這孤獨的城市落下 安居 我忘記了 大地是不能觸碰的 一夜細雨 無處可躲的 我知道 我早就知...
    趙晨君閱讀 170評論 0 0
  • 今天發(fā)現(xiàn)一件事情剪廉。 我曾經(jīng)以為娃循,那些在心里被反復斟酌了很久的話終于說出口應該會很痛快,可是說出口的那一剎那卻發(fā)現(xiàn)自...
    彩云聚散閱讀 294評論 0 0