爬蟲入門--第一只小爬蟲

最近開始學(xué)習(xí)爬蟲啃奴,從最簡單的爬糗事百科網(wǎng)開始,要爬的是24小時熱榜套么,網(wǎng)站長這樣:

糗事百科.png

看下網(wǎng)頁源碼:

源碼.png

可以看到要爬的糗事的位置,等下要寫正則

OK碳蛋,下面開始打開PYTHON胚泌,要用urllib,urllib2包,和re包
Request訪問網(wǎng)頁肃弟,urlopen打開網(wǎng)頁玷室,read把網(wǎng)頁內(nèi)容讀取下來
然后正則匹配要查找的內(nèi)容

# -*- coding: utf-8 -*-
import urllib
import urllib2
import re
#import sys
#reload(sys)
#sys.setdefaultencoding('uft-8')
page=1
url='http://www.qiushibaike.com/hot/page/'+str(page)
user_agent='Mozilla/4.0(compatible;MSIE 5.5;Windows NT)'
headers = {'User-Agent': user_agent}
try:
    request = urllib2.Request(url,headers= headers)
    response =urllib2.urlopen(request)
    content =response.read().decode('utf-8')
    
    
   pattern = re.compile('<span>([^<].*?)</span>.*?<div.*?>\s<span.*?>\s*?<span.*?>(\d*?)</i>',re.S)
    items =re.findall(pattern,content)
    #把匹配內(nèi)容存入文檔
    a = open("E:\edx 6.001\qsbk.txt","w")
    for item in items:
        
        a.write(item[0].encode('utf-8'))
        a.write('\n')
        a.write(item[1])
        a.write('\n')
    a.close()
  

        
except urllib2.URLError as e:
    if hasattr(e,"code"):
        print  e.code
    if hasattr(e,"reason"):
        print e.reason

這是爬下來的糗事:

糗事百科.png

爬下來后該干嘛呢零蓉,不如發(fā)郵件給好友分享一下,發(fā)郵件怎么能手寫呢穷缤,寫個python吧壁公,
python庫里有訪問郵件服務(wù)器的包
有幾點要注意的:
首先,要打開你使用的郵箱的SMTP服務(wù)绅项,登錄郵箱設(shè)置一下紊册;
然后會要你設(shè)置一個授權(quán)碼,以下代碼里的password要寫這個授權(quán)碼快耿,而不是你的郵箱密碼囊陡。
之后我運行發(fā)現(xiàn)發(fā)不出去郵件,報554錯誤掀亥,原來被網(wǎng)易當(dāng)垃圾郵件攔截撞反,到網(wǎng)上找了一圈,終于發(fā)現(xiàn)搪花,要加兩行代碼:就是'from' 'to'要寫上郵箱


import smtplib  
from email.mime.multipart import MIMEMultipart  
from email.mime.text import MIMEText  
from email.mime.image import MIMEImage  
  
sender = '*****@126.com'  
receiver = '*******@qq.com'  
subject = 'python email test'  
smtpserver = 'smtp.126.com'  
username = '********'  
password = '1111111'  
  
msgRoot = MIMEMultipart('related')  
msgRoot['Subject'] = 'test mail'  

#防止被當(dāng)垃圾郵件攔截
msgRoot['from']='*******@126.com'
msgRoot['to']='********@qq.com'

#構(gòu)造附件  
att = MIMEText(open('qsbk.txt', 'rb').read(), 'base64', 'utf-8')  
att["Content-Type"] = 'application/octet-stream'  
att["Content-Disposition"] = 'attachment; filename="it's funny.txt"'  
msgRoot.attach(att)  
        
smtp = smtplib.SMTP()  
smtp.connect('smtp.126.com')  
smtp.login(username, password)  
smtp.sendmail(sender, receiver, msgRoot.as_string())  
smtp.quit()  
print ("ok")

之后干嘛呢遏片,可以建個bat批處理,每天定時發(fā)送撮竿,嘿嘿

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末吮便,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子幢踏,更是在濱河造成了極大的恐慌髓需,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,188評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件房蝉,死亡現(xiàn)場離奇詭異僚匆,居然都是意外死亡,警方通過查閱死者的電腦和手機搭幻,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評論 3 395
  • 文/潘曉璐 我一進店門咧擂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人檀蹋,你說我怎么就攤上這事松申。” “怎么了续扔?”我有些...
    開封第一講書人閱讀 165,562評論 0 356
  • 文/不壞的土叔 我叫張陵攻臀,是天一觀的道長。 經(jīng)常有香客問我纱昧,道長刨啸,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,893評論 1 295
  • 正文 為了忘掉前任识脆,我火速辦了婚禮设联,結(jié)果婚禮上善已,老公的妹妹穿的比我還像新娘。我一直安慰自己离例,他們只是感情好换团,可當(dāng)我...
    茶點故事閱讀 67,917評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著宫蛆,像睡著了一般艘包。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上耀盗,一...
    開封第一講書人閱讀 51,708評論 1 305
  • 那天想虎,我揣著相機與錄音,去河邊找鬼叛拷。 笑死舌厨,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的忿薇。 我是一名探鬼主播裙椭,決...
    沈念sama閱讀 40,430評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼署浩!你這毒婦竟也來了揉燃?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,342評論 0 276
  • 序言:老撾萬榮一對情侶失蹤瑰抵,失蹤者是張志新(化名)和其女友劉穎你雌,沒想到半個月后器联,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體二汛,經(jīng)...
    沈念sama閱讀 45,801評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,976評論 3 337
  • 正文 我和宋清朗相戀三年拨拓,在試婚紗的時候發(fā)現(xiàn)自己被綠了肴颊。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,115評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡渣磷,死狀恐怖婿着,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情醋界,我是刑警寧澤竟宋,帶...
    沈念sama閱讀 35,804評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站形纺,受9級特大地震影響丘侠,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜逐样,卻給世界環(huán)境...
    茶點故事閱讀 41,458評論 3 331
  • 文/蒙蒙 一蜗字、第九天 我趴在偏房一處隱蔽的房頂上張望打肝。 院中可真熱鬧,春花似錦挪捕、人聲如沸粗梭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽断医。三九已至躲叼,卻和暖如春届谈,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背惦蚊。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評論 1 272
  • 我被黑心中介騙來泰國打工亥贸, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留躬窜,地道東北人。 一個月前我還...
    沈念sama閱讀 48,365評論 3 373
  • 正文 我出身青樓炕置,卻偏偏與公主長得像荣挨,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子朴摊,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,055評論 2 355

推薦閱讀更多精彩內(nèi)容