爬妹子圖

利用 selenium + PhantomJS 爬取 妹子圖

import requests
import time
import os
from selenium import webdriver

class Spider(object):

    def __init__(self):
        self.driver = webdriver.PhantomJS()

    def Get_pages(self, maxpage):
        # 想要爬取的頁(yè)面數(shù)量
        for page in range(1, maxpage+1):
            url = "http://www.mzitu.com/page/" + str(page)
            self.Get_content_page(url)

    def Get_content_page(self, url):
        # 獲取封面圖片對(duì)應(yīng)的詳細(xì)圖片地址
        self.driver.get(url)
        a = self.driver.find_elements_by_id('pins')
        b = a[0].find_elements_by_tag_name('a')
        links = []
        for i in b:
            if i.get_attribute('href') not in links:  # 該網(wǎng)頁(yè)源碼片段有兩次網(wǎng)址重復(fù)胖替,過濾下
                links.append(i.get_attribute('href'))
        for link in links:
            self.Get_picture_page(link)

    def Get_picture_page(self, url):
        #獲取該組圖片數(shù)量及圖片下載地址
        self.driver.get(url)
        title_site = self.driver.find_element_by_tag_name('h2')         #該組圖片名字位置
        title = title_site.text                                         #該組圖片名字
        os.mkdir(title)                                                 #以該名字建立文件夾
        pages_site = self.driver.find_element_by_class_name('pagenavi')  #從標(biāo)簽欄找出圖片最大頁(yè)數(shù)
        all_sites = pages_site.find_elements_by_tag_name('a')
        page = []
        for i in all_sites:
            page.append(i.text)
        picture_max_number = int(page[-2]) + 1                             #最大頁(yè)數(shù)在倒二位置
        for i in range(1, picture_max_number):
            picture_link = url + '/' + str(i)
            self.Download_picture(picture_link, title, i)
        print('Done one')



    def Download_picture(self,link,filename,picture_number):
        #下載圖片

        headers = {                                                         #圖片下載鏈接的請(qǐng)求頭
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
            'Accept-Encoding': 'gzip, deflate, sdch',
            'Accept-Language': 'zh-CN,zh;q=0.8',
            'Cache-Control': 'max-age=0',
            'Connection': 'keep-alive',
            'Host': 'i.meizitu.net',
            'If-Modified-Since': 'Thu, 02 Mar 2017 14:12:51 GMT',
            'If-None-Match': "58b82863-28887",
            'Upgrade-Insecure-Requests': '1',
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
        }
        time.sleep(1)
        self.driver.get(link)
        path = os.getcwd() + '\\' + filename + '\\' + str(picture_number) + '.jpg'
        e = self.driver.find_element_by_tag_name('p')
        f = e.find_element_by_tag_name('img')
        picture_download_link = f.get_attribute('src')
        picture = requests.get(picture_download_link, headers=headers)
        if picture.status_code == 200:
            open(path, 'wb').write(picture.content)

if __name__ == '__main__':
    spider = Spider()
    spider.Get_pages(3)

By The Way : 營(yíng)養(yǎng)跟不上了

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末研儒,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子独令,更是在濱河造成了極大的恐慌端朵,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,376評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件燃箭,死亡現(xiàn)場(chǎng)離奇詭異冲呢,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)遍膜,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門碗硬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瓢颅,你說我怎么就攤上這事恩尾。” “怎么了挽懦?”我有些...
    開封第一講書人閱讀 156,966評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵翰意,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我信柿,道長(zhǎng)冀偶,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,432評(píng)論 1 283
  • 正文 為了忘掉前任渔嚷,我火速辦了婚禮进鸠,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘形病。我一直安慰自己客年,他們只是感情好霞幅,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,519評(píng)論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著量瓜,像睡著了一般司恳。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上绍傲,一...
    開封第一講書人閱讀 49,792評(píng)論 1 290
  • 那天扔傅,我揣著相機(jī)與錄音,去河邊找鬼烫饼。 笑死猎塞,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的杠纵。 我是一名探鬼主播邢享,決...
    沈念sama閱讀 38,933評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼淡诗!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起伊履,我...
    開封第一講書人閱讀 37,701評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤韩容,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后唐瀑,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體群凶,經(jīng)...
    沈念sama閱讀 44,143評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,488評(píng)論 2 327
  • 正文 我和宋清朗相戀三年哄辣,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了请梢。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,626評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡力穗,死狀恐怖毅弧,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情当窗,我是刑警寧澤够坐,帶...
    沈念sama閱讀 34,292評(píng)論 4 329
  • 正文 年R本政府宣布,位于F島的核電站崖面,受9級(jí)特大地震影響元咙,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜巫员,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,896評(píng)論 3 313
  • 文/蒙蒙 一庶香、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧简识,春花似錦赶掖、人聲如沸感猛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)唱遭。三九已至,卻和暖如春呈驶,著一層夾襖步出監(jiān)牢的瞬間拷泽,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工袖瞻, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留司致,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,324評(píng)論 2 360
  • 正文 我出身青樓聋迎,卻偏偏與公主長(zhǎng)得像脂矫,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子霉晕,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,494評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • 利用 BeautifulSoup + Requests 爬取 妹子圖
    交易狗二哈閱讀 475評(píng)論 0 2
  • 有個(gè)網(wǎng)站 http://www.meizitu.com/ 里面有很多妹子庭再,所以就動(dòng)了心思,是不是可以爬到我的本地來...
    豪哥的世界閱讀 749評(píng)論 3 0
  • 文檔流的概念牺堰,如何讓元素脫離文檔流 文檔流指的是瀏覽器按照html的內(nèi)容按順序解析并呈現(xiàn)拄轻,遇到行內(nèi)元素就往行內(nèi)放,...
    柯良勇閱讀 403評(píng)論 0 0
  • 我是誰(shuí)伟葫?第一次正式的思考這個(gè)問題恨搓,是看了張德芬的 《遇見未知的自己》,而今天提筆的時(shí)候筏养,我腦子里飄過來一些...
    啟橋閱讀 342評(píng)論 0 0
  • 己經(jīng)進(jìn)入秋天模式了斧抱,但天氣還不是“天涼好個(gè)秋",尤其是這一周渐溶,好像又熱了許多辉浦,雖然天氣有些不爽,但整個(gè)人的心情掌猛,整...
    鄭治中閱讀 129評(píng)論 1 2