麻瓜編程·python實戰(zhàn)·1-4作業(yè)：爬取Taylor Swift

我的結(jié)果：

Talor Swift

我的代碼：

from bs4 import  BeautifulSoup
import requests, urllib.request
import time, os

# 收納圖片地址
img_url = []  
# 目標(biāo)網(wǎng)頁，20頁
urls = ['http://weheartit.com/inspirations/taylorswift?page={}&before=253730307'.format(str(i)) for i in range(1, 21)]   

#解析網(wǎng)頁赔嚎，獲取圖片地址膘盖，返回列表
def get_img_urls(url):
    time.sleep(5)
    web_data = requests.get(url)
    soup = BeautifulSoup(web_data.text, 'lxml')
    imgs = soup.select('div[id="main-container"] > div:nth-of-type(2) > div > div > div > div > a > img')
    for img in imgs:
        img = img.get('src')
        img_url.append(img)
    return img_url

# 下載圖片
def img_retrieve(item):
    # 新建路徑
    if not os.path.exists(r'C:/Users/Administrator/desktop/Taylor_Switf/'):
        os.mkdir(r'C:/Users/Administrator/desktop/Taylor_Switf/')
    item_path = 'C:/Users/Administrator/desktop/Taylor_Switf/'
   # 下載圖片，用序號命名
    urllib.request.urlretrieve(item, item_path + item[-14:].replace('superthumb',str(img_url.index(item))))

#起點
for url in urls:
    get_img_urls(url)

for item in img_url:
    img_retrieve(item)

我的感想：

用時兩個小時十五分鐘
關(guān)于網(wǎng)站（weheartit.com/）我想說：

群里有人說需要代理才能爬尤误，但是我沒用侠畔，而且之前很多人反映網(wǎng)站速度慢，但我今天卻很快损晤。不知道發(fā)生了什么软棺，也許改版了？
當(dāng)我在檢查網(wǎng)頁結(jié)構(gòu)的時候尤勋，我發(fā)現(xiàn)圖片都是webp格式的：
webp格式
但是我爬取出來的數(shù)據(jù)卻是全部都是superthumb.jpg：
superthumb.jpg
不知道發(fā)生了什么喘落。

關(guān)于代碼我想說：

我的select語句用很長茵宪，別人的很短，如：'img[class="entry_thumbnail"]
關(guān)于文件夾路徑瘦棋，使用 import os稀火。

檢查路徑存在：os.path.exists
建立路徑：os.mkdr/os.mkdirs

其實每次爬蟲運行的過程都感覺挺驚險的。希望能快快進(jìn)步赌朋。

最后編輯于：2017.12.04 01:27:08

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末憾股，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子箕慧，更是在濱河造成了極大的恐慌服球，老刑警劉巖，帶你破解...
沈念sama閱讀 218,284評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件颠焦，死亡現(xiàn)場離奇詭異斩熊，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)伐庭，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,115評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門粉渠，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人圾另，你說我怎么就攤上這事霸株。” “怎么了集乔？”我有些...
開封第一講書人閱讀 164,614評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵去件，是天一觀的道長。經(jīng)常有香客問我扰路，道長尤溜，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,671評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任汗唱，我火速辦了婚禮宫莱，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘哩罪。我一直安慰自己授霸，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,699評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布际插。她就那樣靜靜地躺著碘耳，像睡著了一般。火紅的嫁衣襯著肌膚如雪腹鹉。梳的紋絲不亂的頭發(fā)上藏畅，一...
開封第一講書人閱讀 51,562評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼愉阎。笑死绞蹦，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的榜旦。我是一名探鬼主播幽七，決...
沈念sama閱讀 40,309評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼溅呢！你這毒婦竟也來了澡屡？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,223評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤咐旧，失蹤者是張志新（化名）和其女友劉穎驶鹉，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體铣墨，經(jīng)...
沈念sama閱讀 45,668評論 1贊 314
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡室埋，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,859評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了伊约。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片姚淆。...
茶點故事閱讀 39,981評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖屡律，靈堂內(nèi)的尸體忽然破棺而出腌逢，到底是詐尸還是另有隱情，我是刑警寧澤超埋，帶...
沈念sama閱讀 35,705評論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布搏讶，位于F島的核電站，受9級特大地震影響纳本，放射性物質(zhì)發(fā)生泄漏窍蓝。R本人自食惡果不足惜腋颠，卻給世界環(huán)境...
茶點故事閱讀 41,310評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一繁成、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧淑玫，春花似錦巾腕、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,904評論 0贊 22
一樁弒父案尊搬，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至土涝，卻和暖如春佛寿，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,023評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工冀泻，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留常侣，地道東北人。一個月前我還...
沈念sama閱讀 48,146評論 3贊 370
代替公主和親
正文我出身青樓弹渔，卻偏偏與公主長得像胳施，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子肢专，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,933評論 2贊 355

麻瓜編程·python實戰(zhàn)·1-4作業(yè)：爬取Taylor Swift

我的結(jié)果：

我的代碼：

我的感想：

推薦閱讀更多精彩內(nèi)容