2021-01-19初學(xué)爬蟲日記

其實(shí)很早之前就知道爬蟲了慢哈,只是職業(yè)無關(guān),也沒怎么去注意永票。知道前段時間知道這個很火卵贱,可以用來賺錢滥沫,也在一些平臺上發(fā)現(xiàn)有人發(fā)布信息,叫人寫爬蟲爬某個網(wǎng)站的數(shù)據(jù)艰赞,10億+的數(shù)據(jù)佣谐,開價3-5W。雖然說是僧多肉少方妖。但這多一門技能狭魂,多一份收入還是比較可觀的。更有人靠爬蟲月入3W党觅。雌澄。。不知道真假杯瞻,如果是真镐牺,應(yīng)該也是經(jīng)營漫長時間了。畢竟技術(shù)不是難題魁莉,客戶睬涧,推廣才是難題。

今天也終于去看看一些爬蟲入門的東西旗唁。

說實(shí)話畦浓,這些入門教程看了之后實(shí)在是沒啥難度〖煲撸基本上就是requests讶请,re,io,的操作屎媳。但尷尬的是一如既往地抄別人的東西都報(bào)錯夺溢。小單元測試沒錯,放到整個程序里面就報(bào)錯烛谊。风响。〉べ鳎看著也沒啥錯状勤,但弄了很久,這就是偷懶的結(jié)果--原本只是想體驗(yàn)一下而已湃崩。后面就自己修改了部分代碼荧降。主要是他對返回結(jié)果和保存圖片寫得不大好接箫,寫了一大堆攒读。。辛友。

入門還是簡單的薄扁,還是需要深入學(xué)習(xí)剪返。當(dāng)量起來的時候,就是經(jīng)驗(yàn)積累的時候邓梅,就是真正學(xué)到東西的時候脱盲!

下面是我寫的一個簡單例子。從例子可以看出日缨,基本就是python的基礎(chǔ)應(yīng)用嘛钱反。。匣距。沒啥難度面哥。

運(yùn)行過,沒問題毅待。但這里的文章格式問題尚卫,代碼復(fù)制到編輯器上需要格式化,否則報(bào)錯尸红。

(PS:如果你對爬蟲有興趣吱涉,看代碼覺得難,可以關(guān)注我外里,我在持續(xù)寫python教程)


import requests#需要安裝requests

from bs4import BeautifulSoup#需要安裝bs4

import os# 導(dǎo)入os模塊

from ioimport BytesIO

from PILimport Image#需要安裝pillow

import re

import urllib3

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)#禁用安全警告

def mkdir(path):##這個函數(shù)創(chuàng)建文件夾

? ? path = path.strip()

isExists = os.path.exists(path)

if not isExists:

print('創(chuàng)建名字叫做', path, '的文件夾')

os.makedirs(path)

print('創(chuàng)建成功怎爵!')

else:

print(path, '文件夾已經(jīng)存在了,不再創(chuàng)建')

print('開始網(wǎng)頁get請求')

print('開始創(chuàng)建文件夾')

folder_path ='i:\BeautifulPicture'

mkdir(folder_path)# 創(chuàng)建文件夾

print('開始切換文件夾')

os.chdir(folder_path)# 切換路徑至上面創(chuàng)建的文件夾

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36'}#給請求指定一個請求頭來模擬chrome瀏覽器

web_url ='https://www.quanjing.com/'

p =r"(https:\S{1,}.jpg)"

pattern = re.compile(p)

r = requests.get(web_url, headers=headers)#像目標(biāo)url地址發(fā)送get請求级乐,返回一個response對象

all_a = BeautifulSoup(r.text, 'lxml').find_all('img')#獲取網(wǎng)頁中的class為item的所有a標(biāo)簽

tar = re.findall(pattern, str(all_a))#返回列表

for ain tar:

pn = os.path.split(a)[1]

try:

resp = requests.get(a, verify=False)#verify用于解決https 提示sslerror問題

? ? ? ? with open(pn, 'ab')as fp:

fp.write(resp.content)

print(pn, '圖片保存成功疙咸!')

#以下方法也行

? ? ? ? # im = Image.open(BytesIO(resp.content))

# im.save(os.path.join(folder_path, pn))

? ? except ConnectionError as e:

print(e)

print("保存圖片失敗")

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市风科,隨后出現(xiàn)的幾起案子撒轮,更是在濱河造成了極大的恐慌,老刑警劉巖贼穆,帶你破解...
    沈念sama閱讀 212,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件题山,死亡現(xiàn)場離奇詭異,居然都是意外死亡故痊,警方通過查閱死者的電腦和手機(jī)顶瞳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來愕秫,“玉大人慨菱,你說我怎么就攤上這事〈魉Γ” “怎么了符喝?”我有些...
    開封第一講書人閱讀 158,369評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長甜孤。 經(jīng)常有香客問我协饲,道長畏腕,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,799評論 1 285
  • 正文 為了忘掉前任茉稠,我火速辦了婚禮描馅,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘而线。我一直安慰自己铭污,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,910評論 6 386
  • 文/花漫 我一把揭開白布膀篮。 她就那樣靜靜地躺著况凉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪各拷。 梳的紋絲不亂的頭發(fā)上刁绒,一...
    開封第一講書人閱讀 50,096評論 1 291
  • 那天,我揣著相機(jī)與錄音烤黍,去河邊找鬼知市。 笑死,一個胖子當(dāng)著我的面吹牛速蕊,可吹牛的內(nèi)容都是我干的嫂丙。 我是一名探鬼主播,決...
    沈念sama閱讀 39,159評論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼规哲,長吁一口氣:“原來是場噩夢啊……” “哼跟啤!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起唉锌,我...
    開封第一講書人閱讀 37,917評論 0 268
  • 序言:老撾萬榮一對情侶失蹤隅肥,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后袄简,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體腥放,經(jīng)...
    沈念sama閱讀 44,360評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,673評論 2 327
  • 正文 我和宋清朗相戀三年绿语,在試婚紗的時候發(fā)現(xiàn)自己被綠了秃症。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,814評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡吕粹,死狀恐怖种柑,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情匹耕,我是刑警寧澤聚请,帶...
    沈念sama閱讀 34,509評論 4 334
  • 正文 年R本政府宣布,位于F島的核電站泌神,受9級特大地震影響良漱,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜欢际,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,156評論 3 317
  • 文/蒙蒙 一母市、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧损趋,春花似錦患久、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至桐玻,卻和暖如春篙挽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背镊靴。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評論 1 267
  • 我被黑心中介騙來泰國打工铣卡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人偏竟。 一個月前我還...
    沈念sama閱讀 46,641評論 2 362
  • 正文 我出身青樓煮落,卻偏偏與公主長得像,于是被迫代替她去往敵國和親踊谋。 傳聞我的和親對象是個殘疾皇子蝉仇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,728評論 2 351

推薦閱讀更多精彩內(nèi)容