Python簡單爬蟲圖片

利用Python進(jìn)行簡單的一些圖片網(wǎng)站爬蟲。

我們分為三部分來完成這個爬蟲
獲取頁數(shù)的url - 解析頁面的HTLM - 下載圖片

PAGE的url是這樣的:www.91doutu.com/category/qq表情包/page/1
我們可以用for循環(huán)來遍歷出我們需要爬蟲的頁數(shù)笛钝。

BASE_PAGE_URL = 'http://www.91doutu.com/category/qq%E8%A1%A8%E6%83%85%E5%8C%85/page/'
for i in range(0,11):
    print BASE_PAGE_URL + str(i)

這樣就獲取到了我們需要的page_url了重罪。

PAGE_URL

接下來我們來完成第二步

解析頁面的HTML源碼 獲取我們需要的部分宵溅。

#encoding
import requests
from bs4 import BeautifulSoup

response = requests.get('http://www.91doutu.com/category/qq%E8%A1%A8%E6%83%85%E5%8C%85')
content = response.content
soup = BeautifulSoup(content,'lxml')
img_list = soup.find_all('img',attrs={'class':'thumb'})
for img in img_list:
    print img['data-src']

這樣就獲取到了我們需要的圖片url了项滑。

Img_List

第三步-下載

只需要用到一個函數(shù)就輕輕松松搞定曙旭。

首先分割url 取list最后一個元素來當(dāng)做我們的文件名,然后再下載到images目錄下别垮。

#encoding
import requests
from bs4 import BeautifulSoup
import os
import urllib

def download_image(url):
    split_list = url.split('/')
    filename = split_list.pop()
    path = os.path.join('images',filename)
    urllib.urlretrieve(url,filename=path)

response = requests.get('http://www.91doutu.com/category/qq%E8%A1%A8%E6%83%85%E5%8C%85')
content = response.content
soup = BeautifulSoup(content,'lxml')
img_list = soup.find_all('img',attrs={'class':'thumb'})
for img in img_list:
    url = img['data-src']
    download_image(url)
download_img

完整的Code:

#encoding
#_PlugName_ = Spider_Img
#__Author__ = Search__
# @Time    : 2017/8/29
#__Refer___ = http://www.reibang.com/u/d743d12d1d77

import requests
from bs4 import BeautifulSoup
import os
import urllib

BASE_PAGE_URL = 'http://www.91doutu.com/category/qq%E8%A1%A8%E6%83%85%E5%8C%85/page/'
PAGE_URL_LIST = []
for x in range(7,10):
    url = BASE_PAGE_URL + str(x)
    PAGE_URL_LIST.append(url)

def download_image(url):
    split_list = url.split('/')
    filename = split_list.pop()
    path = os.path.join('images',filename)
    urllib.urlretrieve(url,filename=path)

def get_page(page_url):
    response = requests.get(page_url)
    content = response.content
    soup = BeautifulSoup(content,'lxml')
    img_list = soup.find_all('img',attrs={'class':'thumb'})
    for img in img_list:
        url = img['data-src']
        download_image(url)

def main():
    for page_url in PAGE_URL_LIST:
        get_page(page_url)

if __name__ == "__main__":
    main()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末便监,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子碳想,更是在濱河造成了極大的恐慌烧董,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件胧奔,死亡現(xiàn)場離奇詭異逊移,居然都是意外死亡,警方通過查閱死者的電腦和手機龙填,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門胳泉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人岩遗,你說我怎么就攤上這事扇商。” “怎么了宿礁?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵案铺,是天一觀的道長。 經(jīng)常有香客問我窘拯,道長红且,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任涤姊,我火速辦了婚禮暇番,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘思喊。我一直安慰自己壁酬,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布恨课。 她就那樣靜靜地躺著舆乔,像睡著了一般。 火紅的嫁衣襯著肌膚如雪剂公。 梳的紋絲不亂的頭發(fā)上希俩,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天,我揣著相機與錄音纲辽,去河邊找鬼颜武。 笑死璃搜,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的鳞上。 我是一名探鬼主播这吻,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼篙议!你這毒婦竟也來了唾糯?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤鬼贱,失蹤者是張志新(化名)和其女友劉穎移怯,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吩愧,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡芋酌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了雁佳。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片脐帝。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖糖权,靈堂內(nèi)的尸體忽然破棺而出堵腹,到底是詐尸還是另有隱情,我是刑警寧澤星澳,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布疚顷,位于F島的核電站,受9級特大地震影響禁偎,放射性物質(zhì)發(fā)生泄漏腿堤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一如暖、第九天 我趴在偏房一處隱蔽的房頂上張望笆檀。 院中可真熱鬧,春花似錦盒至、人聲如沸酗洒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽樱衷。三九已至,卻和暖如春酒唉,著一層夾襖步出監(jiān)牢的瞬間矩桂,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工痪伦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留耍鬓,地道東北人阔籽。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓流妻,卻偏偏與公主長得像牲蜀,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子绅这,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容

  • 聲明:本文講解的實戰(zhàn)內(nèi)容涣达,均僅用于學(xué)習(xí)交流,請勿用于任何商業(yè)用途证薇! 一度苔、前言 強烈建議:請在電腦的陪同下,閱讀本文...
    Bruce_Szh閱讀 12,679評論 6 28
  • 1 前言 作為一名合格的數(shù)據(jù)分析師浑度,其完整的技術(shù)知識體系必須貫穿數(shù)據(jù)獲取寇窑、數(shù)據(jù)存儲、數(shù)據(jù)提取箩张、數(shù)據(jù)分析甩骏、數(shù)據(jù)挖掘、...
    whenif閱讀 18,052評論 45 523
  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 171,518評論 25 707
  • 常常會聽到一些過去的歌曲,腦海里就會浮現(xiàn)出一個特別的場景论熙。 每年六月份福青! 是我們各個學(xué)校 的畢業(yè)季! 在畢業(yè)季里脓诡!...
    李_昀倩閱讀 164評論 0 1
  • 還記得博物館奇妙夜3里復(fù)活的大英博物文物嗎?那些有腿有腳的跑來跑去无午,而頭像類的只能是聊聊天。 這是大英展的第79號...
    遼Atom閱讀 516評論 0 3