Python爬煎蛋網(wǎng)的圖片——老司機(jī)的第一步

最近一直在看廖大的教程，但是看著看著，我好無聊啊屑墨，于是就去找了一些煎蛋（簡單）的爬蟲小知識卵史，意外的打開了~~新世界的大門~~。啊哈忧设，這下安逸咯~

煎蛋說下代碼

這個是主程序址晕，可以看到鏈接以及頁碼谨垃，以及啟動函數(shù) star()

if __name__=='__main__':
    url = 'http://jandan.net/ooxx/page-1#comments'
    pages = 58
    start()

這個是star()函數(shù)，我們對鏈接進(jìn)行頁碼的增加胳赌，同時通過函數(shù)open_url()獲取每頁的資源,且通過函數(shù)get_img()對圖片進(jìn)行本地化保存

def start():
    for j in range(1,pages+1):
        url2 = url

        url2 = url2[:28]+str(j)+url[29:]

        print(url2)

        get_img(open_url(url2))

        print('已經(jīng)爬去取到第'+str(j) +'頁')

這個是open_url()函數(shù)

def open_url(url2):
    #請求
    request = urllib.request.Request(url2)
    #響應(yīng)
    response = urllib.request.urlopen(request)

    data = response.read()
    #轉(zhuǎn)碼
    data = data.decode('utf-8')

    return data

這個是get_img()函數(shù),里面saveFile()這個函數(shù)是對把圖標(biāo)保存到本地牡直。還有這個正則表達(dá)式碰逸，我不會乡小，我抄的满钟，大意我懂胳喷，但是寫不出來- - 不過有講正則的吠撮，你們可以搜下簡書上的正則表達(dá)式文章

def get_img(html):

    # 從網(wǎng)頁源代碼中篩選出圖片的鏈接
    p = re.compile(r'src="([^"]+\.jpg)"')

    imglist = p.findall(html)

    for each in set(imglist):

        # 拼接鏈接
        each = 'https:' + each

        print(each)

        try:
            # 保存到本地
            urllib.request.urlretrieve(each, saveFile(each))
        except:
            print('失敗')

最后一個函數(shù)saveFile()

def saveFile(path):
    #檢測當(dāng)前路徑的有效性
    if not os.path.isdir(targetPath):
        os.mkdir(targetPath)

    #設(shè)置每個圖片的路徑
    pos = path.rindex('/')
    t = os.path.join(targetPath,path[pos+1:])
    return t

當(dāng)然還有頭文件

import urllib.request,re,os

#本地保存路徑 這個寫你們自己的路徑就行了
targetPath = "/Users/wangshengquan/Pictures/PythonImage"

運(yùn)行圖

成果圖

最后是全部代碼

#!/usr/bin/env python3
# _*_ coding: utf-8 _*_


import urllib.request,re,os

#本地保存路徑
targetPath = "/Users/wangshengquan/Pictures/PythonImage"

def saveFile(path):
    #檢測當(dāng)前路徑的有效性
    if not os.path.isdir(targetPath):
        os.mkdir(targetPath)

    #設(shè)置每個圖片的路徑
    pos = path.rindex('/')
    t = os.path.join(targetPath,path[pos+1:])
    return t


def open_url(url2):
    #請求
    request = urllib.request.Request(url2)
    #響應(yīng)
    response = urllib.request.urlopen(request)

    data = response.read()
    #轉(zhuǎn)碼
    data = data.decode('utf-8')

    return data

def get_img(html):

    # 從網(wǎng)頁源代碼中篩選出圖片的鏈接
    p = re.compile(r'src="([^"]+\.jpg)"')

    imglist = p.findall(html)

    for each in set(imglist):

        # 拼接鏈接
        each = 'https:' + each

        print(each)

        try:
            # 保存到本地
            urllib.request.urlretrieve(each, saveFile(each))
        except:
            print('失敗')

def start():
    for j in range(1,pages+1):
        url2 = url

        url2 = url2[:28]+str(j)+url[29:]

        print(url2)

        get_img(open_url(url2))

        print('已經(jīng)爬去取到第'+str(j) +'頁')


if __name__=='__main__':
    url = 'http://jandan.net/ooxx/page-1#comments'
    pages = 58
    start()

Python有著豐富的第三方泥兰，確實(shí)很方便，而且很簡潔题禀，接下來的話鞋诗，如果可以的話，我希望自己能夠繼續(xù)磨煉自己的技術(shù)迈嘹，向tumblr進(jìn)攻~

如果你們看Python實(shí)在無聊的話削彬，可以找些~~有意思~~的網(wǎng)站，激發(fā)自己的學(xué)習(xí)欲望江锨，嗯嗯吃警，接下來我要努力提示自己，早日掌握代理以及爬隱藏視頻連接的技術(shù)啄育，早日推到tumblr~

推薦大神

LEONYao

最后編輯于：2017.12.07 07:07:03

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末酌心，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子挑豌，更是在濱河造成了極大的恐慌安券，老刑警劉巖墩崩，帶你破解...
沈念sama閱讀 211,348評論 6贊 491
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異侯勉，居然都是意外死亡鹦筹，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,122評論 2贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門址貌，熙熙樓的掌柜王于貴愁眉苦臉地迎上來铐拐，“玉大人，你說我怎么就攤上這事练对”轶” “怎么了？”我有些...
開封第一講書人閱讀 156,936評論 0贊 347
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵螟凭，是天一觀的道長虚青。經(jīng)常有香客問我，道長螺男，這世上最難降的妖魔是什么棒厘？我笑而不...
開封第一講書人閱讀 56,427評論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮下隧，結(jié)果婚禮上奢人，老公的妹妹穿的比我還像新娘。我一直安慰自己淆院，他們只是感情好达传，可當(dāng)我...
茶點(diǎn)故事閱讀 65,467評論 6贊 385
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著迫筑，像睡著了一般。火紅的嫁衣襯著肌膚如雪宗弯。梳的紋絲不亂的頭發(fā)上脯燃，一...
開封第一講書人閱讀 49,785評論 1贊 290
城市分裂傳說
那天，我揣著相機(jī)與錄音蒙保，去河邊找鬼辕棚。笑死，一個胖子當(dāng)著我的面吹牛邓厕，可吹牛的內(nèi)容都是我干的逝嚎。我是一名探鬼主播，決...
沈念sama閱讀 38,931評論 3贊 406
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼详恼，長吁一口氣：“原來是場噩夢啊……” “哼补君！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起轨奄，我...
開封第一講書人閱讀 37,696評論 0贊 266
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤彤恶，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后越驻，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體叽掘，經(jīng)...
沈念sama閱讀 44,141評論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡楣铁，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,483評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了更扁。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盖腕。...
茶點(diǎn)故事閱讀 38,625評論 1贊 340
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖浓镜，靈堂內(nèi)的尸體忽然破棺而出溃列，到底是詐尸還是另有隱情，我是刑警寧澤竖哩，帶...
沈念sama閱讀 34,291評論 4贊 329
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布哭廉，位于F島的核電站，受9級特大地震影響相叁，放射性物質(zhì)發(fā)生泄漏遵绰。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,892評論 3贊 312
男人毒藥：我在死后第九天來索命
文/蒙蒙一增淹、第九天我趴在偏房一處隱蔽的房頂上張望椿访。院中可真熱鬧，春花似錦虑润、人聲如沸成玫。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,741評論 0贊 21
一樁弒父案拳喻，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽哭当。三九已至，卻和暖如春冗澈，著一層夾襖步出監(jiān)牢的瞬間钦勘，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,977評論 1贊 265
情欲美人皮
我被黑心中介騙來泰國打工亚亲，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留彻采，地道東北人。一個月前我還...
沈念sama閱讀 46,324評論 2贊 360
代替公主和親
正文我出身青樓捌归，卻偏偏與公主長得像肛响，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子惜索，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,492評論 2贊 348

Python爬煎蛋網(wǎng)的圖片——老司機(jī)的第一步

煎蛋說下代碼

推薦閱讀更多精彩內(nèi)容