beautifulsoup的find_all用法蘸炸,爬取斗圖網(wǎng)圖片

弄不清楚findAll和find_all的區(qū)別。

幾點收獲
  • 使用 find_all取獲取目標(biāo)鏈接
  • 使用urllib庫下載圖片锅知,貌似更簡便
  • 獲取圖片鏈接地址時要注意播急,后面一個圖片往往是未加載完成時顯示的“正在加載”的圖片脓钾,要注意區(qū)分
  • 爬回的鏈接中有個把不符合條件售睹,截取鏈接最后幾個字符 用 in 判斷是否是jpg或gif,不是就直接pass
  • 其他方面沒有難度
  • 下次多選取頁碼范圍可训,下載圖片的時候可以用多線程昌妹。
import requests
from urllib import request
from bs4 import BeautifulSoup
#構(gòu)建目標(biāo)網(wǎng)站鏈接
urls=["http://www.doutula.com/photo/list/?page={}".format(str(i)) for i in range(1,3)]
def get_srcs(url):   #獲取圖片鏈接
    src=[]
    html=requests.get(url)
    soup=BeautifulSoup(html.text,'lxml')
#以下為最關(guān)鍵一句
    srcs=soup.find_all('img',attrs={'class':'img-responsive lazy image_dta'})
    for i in srcs:
        src.append(i['data-original'])  #返回數(shù)組捶枢,想用yield,但是沒弄明白飞崖。
    return src

def down_pic(src):   #下載圖片
    root='d:/py/spider/doutuphoto/'
    if src[-3:] in ['jpg','gif']:
        request.urlretrieve(src,filename=root+src.split('/')[-1])
    else:
        pass

def main():
    for url in urls:
        for i in get_srcs(url):   #此處可加多線程
            down_pic(i)
            print (i)
if __name__=='__main__':
    main()
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末烂叔,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子固歪,更是在濱河造成了極大的恐慌蒜鸡,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,294評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件牢裳,死亡現(xiàn)場離奇詭異逢防,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)蒲讯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,493評論 3 385
  • 文/潘曉璐 我一進(jìn)店門忘朝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人判帮,你說我怎么就攤上這事局嘁。” “怎么了晦墙?”我有些...
    開封第一講書人閱讀 157,790評論 0 348
  • 文/不壞的土叔 我叫張陵悦昵,是天一觀的道長。 經(jīng)常有香客問我晌畅,道長旱捧,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,595評論 1 284
  • 正文 為了忘掉前任踩麦,我火速辦了婚禮枚赡,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘谓谦。我一直安慰自己贫橙,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,718評論 6 386
  • 文/花漫 我一把揭開白布反粥。 她就那樣靜靜地躺著卢肃,像睡著了一般。 火紅的嫁衣襯著肌膚如雪才顿。 梳的紋絲不亂的頭發(fā)上莫湘,一...
    開封第一講書人閱讀 49,906評論 1 290
  • 那天,我揣著相機(jī)與錄音郑气,去河邊找鬼幅垮。 笑死,一個胖子當(dāng)著我的面吹牛尾组,可吹牛的內(nèi)容都是我干的忙芒。 我是一名探鬼主播示弓,決...
    沈念sama閱讀 39,053評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼呵萨!你這毒婦竟也來了奏属?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,797評論 0 268
  • 序言:老撾萬榮一對情侶失蹤潮峦,失蹤者是張志新(化名)和其女友劉穎囱皿,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體忱嘹,經(jīng)...
    沈念sama閱讀 44,250評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡铆帽,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,570評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了德谅。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片爹橱。...
    茶點故事閱讀 38,711評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖窄做,靈堂內(nèi)的尸體忽然破棺而出愧驱,到底是詐尸還是另有隱情,我是刑警寧澤椭盏,帶...
    沈念sama閱讀 34,388評論 4 332
  • 正文 年R本政府宣布组砚,位于F島的核電站,受9級特大地震影響掏颊,放射性物質(zhì)發(fā)生泄漏糟红。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,018評論 3 316
  • 文/蒙蒙 一乌叶、第九天 我趴在偏房一處隱蔽的房頂上張望盆偿。 院中可真熱鬧,春花似錦准浴、人聲如沸事扭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,796評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽求橄。三九已至,卻和暖如春葡公,著一層夾襖步出監(jiān)牢的瞬間罐农,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,023評論 1 266
  • 我被黑心中介騙來泰國打工催什, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留涵亏,地道東北人。 一個月前我還...
    沈念sama閱讀 46,461評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像溯乒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子豹爹,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,595評論 2 350

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 171,825評論 25 707
  • 在中國裆悄,婆媳關(guān)系永遠(yuǎn)是家庭關(guān)系中不可忽略的一部分。 在二十世紀(jì)早期臂聋,中低層家庭都還是兄弟姐妹不分家光稼,一大家子人一起...
    echo_辛閱讀 179評論 1 1
  • 豬肝瘦肉粥 補(bǔ)鋅補(bǔ)血,將豬肝沖洗后放在盆里浸泡1小時孩等,直到除盡殘血艾君,中途最好換水,這樣可以去掉豬肝中殘留的毒素肄方。 ...
    大果果ly閱讀 168評論 0 0