#'https://class.imooc.com/?c=ios&mc_marking=286b51b2a8e40915ea9023c821882e74&mc_channel=L5
# 爬蟲 1 理解爬蟲原理 2 實現(xiàn)一個的圖片爬蟲
# 1 http 2 html 3 正則 過濾條件 4 其它
# 知識點多
# 1 url 2 html src 3 img 4 img url
import urllib
import urllib3
import os
from bs4 import BeautifulSoup
# load url
html = urllib.request.urlopen('https://class.imooc.com/?c=ios&mc_marking=286b51b2a8e40915ea9023c821882e74&mc_channel=L5').read()
# parse url data 1 html 2 'html.parser' 3 'utf-8'
soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')
# img
images = soup.findAll('img')
print(images)
imageName = 0
for image in images:
link = image.get('src')
print('link=',link)
link = 'http:'+link
fileFormat = link[-3:]
if fileFormat == 'png' or fileFormat == 'jpg':
fileSavePath = '/Users/mac/Desktop/DL/'+str(imageName)+'.jpg'
imageName = imageName +1
urllib.request.urlretrieve(link,fileSavePath)
01、簡單爬蟲
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
- 文/潘曉璐 我一進店門挂绰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來屎篱,“玉大人,你說我怎么就攤上這事葵蒂〗徊ィ” “怎么了?”我有些...
- 文/不壞的土叔 我叫張陵践付,是天一觀的道長秦士。 經(jīng)常有香客問我,道長永高,這世上最難降的妖魔是什么隧土? 我笑而不...
- 正文 為了忘掉前任,我火速辦了婚禮命爬,結(jié)果婚禮上曹傀,老公的妹妹穿的比我還像新娘。我一直安慰自己饲宛,他們只是感情好皆愉,可當我...
- 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般幕庐。 火紅的嫁衣襯著肌膚如雪久锥。 梳的紋絲不亂的頭發(fā)上,一...
- 文/蒼蘭香墨 我猛地睜開眼暂氯,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了亮蛔?” 一聲冷哼從身側(cè)響起痴施,我...
- 正文 年R本政府宣布别智,位于F島的核電站宗苍,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏薄榛。R本人自食惡果不足惜讳窟,卻給世界環(huán)境...
- 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望敞恋。 院中可真熱鬧丽啡,春花似錦、人聲如沸硬猫。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽浦徊。三九已至馏予,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間盔性,已是汗流浹背霞丧。 一陣腳步聲響...
推薦閱讀更多精彩內(nèi)容
- python抓取簡單爬蟲時构眯,如果抓取的網(wǎng)頁爬蟲數(shù)據(jù)里面愕难,有不能夠utf-8編碼的(例如html里面的簡體中文), ...
- -- coding: utf-8 -- ****說明 start_urls 默認傳遞給 parse方法解析數(shù)據(jù),s...
- 第一步:拉取鏈接內(nèi)容 第二步:處理d拉取到的內(nèi)容惫霸,使用正則表達式匹配出需要的內(nèi)容猫缭,最后下載文件到本地。