Python爬煎蛋網(wǎng)的圖片——老司機(jī)的第一步

最近一直在看廖大的教程,但是看著看著,我好無聊啊屑墨,于是就去找了一些煎蛋(簡單)的爬蟲小知識卵史,意外的打開了新世界的大門。啊哈忧设,這下安逸咯~

煎蛋說下代碼

這個是主程序址晕,可以看到鏈接以及頁碼谨垃,以及啟動函數(shù) star()

if __name__=='__main__':
    url = 'http://jandan.net/ooxx/page-1#comments'
    pages = 58
    start()

這個是star()函數(shù),我們對鏈接進(jìn)行頁碼的增加胳赌,同時通過函數(shù)open_url()獲取每頁的資源,且通過函數(shù)get_img()對圖片進(jìn)行本地化保存

def start():
    for j in range(1,pages+1):
        url2 = url

        url2 = url2[:28]+str(j)+url[29:]

        print(url2)

        get_img(open_url(url2))

        print('已經(jīng)爬去取到第'+str(j) +'頁')

這個是open_url()函數(shù)

def open_url(url2):
    #請求
    request = urllib.request.Request(url2)
    #響應(yīng)
    response = urllib.request.urlopen(request)

    data = response.read()
    #轉(zhuǎn)碼
    data = data.decode('utf-8')

    return data

這個是get_img()函數(shù),里面saveFile()這個函數(shù)是對把圖標(biāo)保存到本地牡直。還有這個正則表達(dá)式碰逸,我不會乡小,我抄的满钟,大意我懂胳喷,但是寫不出來- - 不過有講正則的吠撮,你們可以搜下簡書上的正則表達(dá)式文章

def get_img(html):

    # 從網(wǎng)頁源代碼中篩選出圖片的鏈接
    p = re.compile(r'src="([^"]+\.jpg)"')

    imglist = p.findall(html)

    for each in set(imglist):

        # 拼接鏈接
        each = 'https:' + each

        print(each)

        try:
            # 保存到本地
            urllib.request.urlretrieve(each, saveFile(each))
        except:
            print('失敗')

最后一個函數(shù)saveFile()

def saveFile(path):
    #檢測當(dāng)前路徑的有效性
    if not os.path.isdir(targetPath):
        os.mkdir(targetPath)

    #設(shè)置每個圖片的路徑
    pos = path.rindex('/')
    t = os.path.join(targetPath,path[pos+1:])
    return t

當(dāng)然還有頭文件

import urllib.request,re,os

#本地保存路徑 這個寫你們自己的路徑就行了
targetPath = "/Users/wangshengquan/Pictures/PythonImage" 
運(yùn)行圖
成果圖

最后是全部代碼

#!/usr/bin/env python3
# _*_ coding: utf-8 _*_


import urllib.request,re,os

#本地保存路徑
targetPath = "/Users/wangshengquan/Pictures/PythonImage"

def saveFile(path):
    #檢測當(dāng)前路徑的有效性
    if not os.path.isdir(targetPath):
        os.mkdir(targetPath)

    #設(shè)置每個圖片的路徑
    pos = path.rindex('/')
    t = os.path.join(targetPath,path[pos+1:])
    return t


def open_url(url2):
    #請求
    request = urllib.request.Request(url2)
    #響應(yīng)
    response = urllib.request.urlopen(request)

    data = response.read()
    #轉(zhuǎn)碼
    data = data.decode('utf-8')

    return data

def get_img(html):

    # 從網(wǎng)頁源代碼中篩選出圖片的鏈接
    p = re.compile(r'src="([^"]+\.jpg)"')

    imglist = p.findall(html)

    for each in set(imglist):

        # 拼接鏈接
        each = 'https:' + each

        print(each)

        try:
            # 保存到本地
            urllib.request.urlretrieve(each, saveFile(each))
        except:
            print('失敗')

def start():
    for j in range(1,pages+1):
        url2 = url

        url2 = url2[:28]+str(j)+url[29:]

        print(url2)

        get_img(open_url(url2))

        print('已經(jīng)爬去取到第'+str(j) +'頁')


if __name__=='__main__':
    url = 'http://jandan.net/ooxx/page-1#comments'
    pages = 58
    start()

Python有著豐富的第三方泥兰,確實(shí)很方便,而且很簡潔题禀,接下來的話鞋诗,如果可以的話,我希望自己能夠繼續(xù)磨煉自己的技術(shù)迈嘹,向tumblr進(jìn)攻~

如果你們看Python實(shí)在無聊的話削彬,可以找些有意思的網(wǎng)站,激發(fā)自己的學(xué)習(xí)欲望江锨,嗯嗯吃警,接下來我要努力提示自己,早日掌握代理以及爬隱藏視頻連接的技術(shù)啄育,早日推到tumblr~

推薦大神

LEONYao

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末酌心,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子挑豌,更是在濱河造成了極大的恐慌安券,老刑警劉巖墩崩,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異侯勉,居然都是意外死亡鹦筹,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進(jìn)店門址貌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來铐拐,“玉大人,你說我怎么就攤上這事练对”轶” “怎么了?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵螟凭,是天一觀的道長虚青。 經(jīng)常有香客問我,道長螺男,這世上最難降的妖魔是什么棒厘? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮下隧,結(jié)果婚禮上奢人,老公的妹妹穿的比我還像新娘。我一直安慰自己淆院,他們只是感情好达传,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著迫筑,像睡著了一般。 火紅的嫁衣襯著肌膚如雪宗弯。 梳的紋絲不亂的頭發(fā)上脯燃,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天,我揣著相機(jī)與錄音蒙保,去河邊找鬼辕棚。 笑死,一個胖子當(dāng)著我的面吹牛邓厕,可吹牛的內(nèi)容都是我干的逝嚎。 我是一名探鬼主播,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼详恼,長吁一口氣:“原來是場噩夢啊……” “哼补君!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起轨奄,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤彤恶,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后越驻,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體叽掘,經(jīng)...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡楣铁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了更扁。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盖腕。...
    茶點(diǎn)故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖浓镜,靈堂內(nèi)的尸體忽然破棺而出溃列,到底是詐尸還是另有隱情,我是刑警寧澤竖哩,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布哭廉,位于F島的核電站,受9級特大地震影響相叁,放射性物質(zhì)發(fā)生泄漏遵绰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一增淹、第九天 我趴在偏房一處隱蔽的房頂上張望椿访。 院中可真熱鬧,春花似錦虑润、人聲如沸成玫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽哭当。三九已至,卻和暖如春冗澈,著一層夾襖步出監(jiān)牢的瞬間钦勘,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工亚亲, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留彻采,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓捌归,卻偏偏與公主長得像肛响,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子惜索,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,492評論 2 348

推薦閱讀更多精彩內(nèi)容