爬蟲之妹子圖爬取

宅男爬蟲學(xué)習(xí)第一課!?宅男們的福利來啦~?

話不多說广辰,直接上代碼!


# -*- encoding: utf-8 -*-

# FUNCTION: Capture beauty picture

import requests

from bs4 import BeautifulSoup

import os

import time

url_list = ['http://www.mzitu.com/201024', 'http://www.mzitu.com/169782']? # interested beauties

headers = {

? ? ? ? 'referer': 'https://www.mzitu.com/201024',

? ? ? ? 'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 '

? ? ? ? ? ? ? ? ? ? ? 'Safari/537.36'

}

def get_page_num(url):

? ? response = requests.get(url, headers=headers)

? ? soup = BeautifulSoup(response.text, 'lxml')

? ? page_num = soup.find(class_='pagenavi').find_all('a')[-2].text

? ? name = soup.find(class_='currentpath').text.split()[-1]

? ? return page_num, name? ? ? ? ? # page_num 是字符串

def parse_page(url):

? ? """

? ? 得到一頁的圖片

? ? :param url: 頁面URL

? ? :return: 圖片鏈接,圖片名稱

? ? """

? ? response = requests.get(url, headers=headers)

? ? soup = BeautifulSoup(response.text, 'lxml')

? ? pic_url = soup.find(class_='main-image').find('img')['src']

? ? pic_name = soup.find(class_='main-title').text

? ? return pic_url, pic_name

def get_pic(pic_url, pic_name, name):

? ? """下載并保存圖片"""

? ? response = requests.get(pic_url, headers=headers, allow_redirects=False)

? ? filepath = '/home/f/crawler/Beauty/photo/' + name + '/' + pic_name + '.jpg'

? ? with open(filepath, 'wb') as f:

? ? ? ? f.write(response.content)

def main():

? ? for url in url_list:

? ? ? ? page_num, name = get_page_num(url)

? ? ? ? try:

? ? ? ? ? ? os.mkdir('/home/f/crawler/Beauty/photo/' + name)

? ? ? ? except FileExistsError:

? ? ? ? ? ? pass

? ? ? ? for page in range(1, int(page_num) + 1):? # range迭代

? ? ? ? ? ? page_url = url + '/' + str(page)

? ? ? ? ? ? print(page_url)

? ? ? ? ? ? pic_url, pic_name = parse_page(page_url)

? ? ? ? ? ? get_pic(pic_url, pic_name, name)

? ? ? ? time.sleep(2)

if __name__ == '__main__':

? ? main()


可以收藏一下翩活,慢慢學(xué)習(xí)哈阱洪!



————————————————————————————————————————————

微信關(guān)注號:**python爬蟲機(jī)器學(xué)習(xí)深度學(xué)習(xí)**

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市菠镇,隨后出現(xiàn)的幾起案子冗荸,更是在濱河造成了極大的恐慌,老刑警劉巖利耍,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蚌本,死亡現(xiàn)場離奇詭異,居然都是意外死亡隘梨,警方通過查閱死者的電腦和手機(jī)程癌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來轴猎,“玉大人嵌莉,你說我怎么就攤上這事∧聿保” “怎么了锐峭?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長可婶。 經(jīng)常有香客問我只祠,道長,這世上最難降的妖魔是什么扰肌? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任抛寝,我火速辦了婚禮,結(jié)果婚禮上曙旭,老公的妹妹穿的比我還像新娘盗舰。我一直安慰自己,他們只是感情好桂躏,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布钻趋。 她就那樣靜靜地躺著,像睡著了一般剂习。 火紅的嫁衣襯著肌膚如雪蛮位。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天鳞绕,我揣著相機(jī)與錄音失仁,去河邊找鬼。 笑死们何,一個胖子當(dāng)著我的面吹牛萄焦,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼拂封,長吁一口氣:“原來是場噩夢啊……” “哼茬射!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起冒签,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤在抛,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后萧恕,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體刚梭,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年廊鸥,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辖所。...
    茶點(diǎn)故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡惰说,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出缘回,到底是詐尸還是另有隱情吆视,我是刑警寧澤,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布酥宴,位于F島的核電站啦吧,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏拙寡。R本人自食惡果不足惜授滓,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望肆糕。 院中可真熱鬧般堆,春花似錦、人聲如沸诚啃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽始赎。三九已至和橙,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間造垛,已是汗流浹背魔招。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留五辽,地道東北人仆百。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像奔脐,于是被迫代替她去往敵國和親俄周。 傳聞我的和親對象是個殘疾皇子吁讨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容