麻瓜編程·python實戰(zhàn)·1-4作業(yè):爬取Taylor Swift

我的結(jié)果:

Talor Swift

我的代碼:

from bs4 import  BeautifulSoup
import requests, urllib.request
import time, os

# 收納圖片地址
img_url = []  
# 目標(biāo)網(wǎng)頁,20頁
urls = ['http://weheartit.com/inspirations/taylorswift?page={}&before=253730307'.format(str(i)) for i in range(1, 21)]   

#解析網(wǎng)頁赔嚎,獲取圖片地址膘盖,返回列表
def get_img_urls(url):
    time.sleep(5)
    web_data = requests.get(url)
    soup = BeautifulSoup(web_data.text, 'lxml')
    imgs = soup.select('div[id="main-container"] > div:nth-of-type(2) > div > div > div > div > a > img')
    for img in imgs:
        img = img.get('src')
        img_url.append(img)
    return img_url

# 下載圖片
def img_retrieve(item):
    # 新建路徑
    if not os.path.exists(r'C:/Users/Administrator/desktop/Taylor_Switf/'):
        os.mkdir(r'C:/Users/Administrator/desktop/Taylor_Switf/')
    item_path = 'C:/Users/Administrator/desktop/Taylor_Switf/'
   # 下載圖片,用序號命名
    urllib.request.urlretrieve(item, item_path + item[-14:].replace('superthumb',str(img_url.index(item))))

#起點
for url in urls:
    get_img_urls(url)

for item in img_url:
    img_retrieve(item)

我的感想:

  1. 用時兩個小時十五分鐘
  2. 關(guān)于網(wǎng)站(weheartit.com/)我想說:
  • 群里有人說需要代理才能爬尤误,但是我沒用侠畔,而且之前很多人反映網(wǎng)站速度慢,但我今天卻很快损晤。不知道發(fā)生了什么软棺,也許改版了?

  • 當(dāng)我在檢查網(wǎng)頁結(jié)構(gòu)的時候尤勋,我發(fā)現(xiàn)圖片都是webp格式的:

  • webp格式
  • 但是我爬取出來的數(shù)據(jù)卻是全部都是superthumb.jpg:

  • superthumb.jpg
  • 不知道發(fā)生了什么喘落。

  1. 關(guān)于代碼我想說:
  • 我的select語句用很長茵宪,別人的很短,如:'img[class="entry_thumbnail"]
  • 關(guān)于文件夾路徑瘦棋,使用 import os稀火。

檢查路徑存在:os.path.exists
建立路徑:os.mkdr/os.mkdirs

  1. 其實每次爬蟲運行的過程都感覺挺驚險的。希望能快快進(jìn)步赌朋。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末憾股,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子箕慧,更是在濱河造成了極大的恐慌服球,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件颠焦,死亡現(xiàn)場離奇詭異斩熊,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)伐庭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進(jìn)店門粉渠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人圾另,你說我怎么就攤上這事霸株。” “怎么了集乔?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵去件,是天一觀的道長。 經(jīng)常有香客問我扰路,道長尤溜,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任汗唱,我火速辦了婚禮宫莱,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘哩罪。我一直安慰自己授霸,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布际插。 她就那樣靜靜地躺著碘耳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪腹鹉。 梳的紋絲不亂的頭發(fā)上藏畅,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼愉阎。 笑死绞蹦,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的榜旦。 我是一名探鬼主播幽七,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼溅呢!你這毒婦竟也來了澡屡?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤咐旧,失蹤者是張志新(化名)和其女友劉穎驶鹉,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體铣墨,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡室埋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了伊约。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片姚淆。...
    茶點故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖屡律,靈堂內(nèi)的尸體忽然破棺而出腌逢,到底是詐尸還是另有隱情,我是刑警寧澤超埋,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布搏讶,位于F島的核電站,受9級特大地震影響纳本,放射性物質(zhì)發(fā)生泄漏窍蓝。R本人自食惡果不足惜腋颠,卻給世界環(huán)境...
    茶點故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一繁成、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧淑玫,春花似錦巾腕、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至土涝,卻和暖如春佛寿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工冀泻, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留常侣,地道東北人。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓弹渔,卻偏偏與公主長得像胳施,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子肢专,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,933評論 2 355

推薦閱讀更多精彩內(nèi)容