爬取個人首頁文章

import requests
from bs4 import BeautifulSoup
import re

#爬取個人簡書首頁文章
articleList=[]  #用于保存所寫的文章
articleInfo={}
jianshu='www.reibang.com'
try:
    r=requests.get('http://www.reibang.com/u/16d377e2ed69')     #獲得了一個Response對象纱新。更改入口時,修改此處鏈接
    print(r.url)
except Exception as e:
    print("The exception is {}".format(e))

soup=BeautifulSoup(r.text,'lxml')
# artList=soup.select('ul > li')  #獲取ul下的直接子節(jié)點li
artList=soup.select('ul[class=note-list]')
# print(len(artList))   #判斷出獲取成功
# print(type(artList))
artList=artList[0]  #轉(zhuǎn)換為Tag類型
# print(type(artList))  #觀察類型
f=open('test.txt','a')
YM=re.compile(r'\d{4}-\d{2}-\d{2}')
HM=re.compile(r'\d\d:\d\d:\d\d')
lenTitle=[]
for article in artList.find_all('li'):
    title=article.find_all('a',class_='title')[0].text
    time=article.select('span[class=time]')[0]['data-shared-at']
    url=article.find_all('a',class_='title')[0]['href']
    getYM=re.search(YM,time)
    getHM=re.search(HM,time)

    finish_time=getYM.group()+'  '+getHM.group()
    lenTitle.append(len(title))
    print('標(biāo)題: %30s  完成時間:%s  地址為: %s%s' % (title,finish_time,jianshu,url),file=f)

下次版本修改:

1.終端輸入用戶名追迟,完成爬取

2.保存至csv文件

3.動態(tài)加載網(wǎng)頁的處理(這個......)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末园细,一起剝皮案震驚了整個濱河市酗失,隨后出現(xiàn)的幾起案子金度,更是在濱河造成了極大的恐慌心赶,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件弥雹,死亡現(xiàn)場離奇詭異垃帅,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)剪勿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進(jìn)店門贸诚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人厕吉,你說我怎么就攤上這事酱固。” “怎么了赴涵?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵媒怯,是天一觀的道長订讼。 經(jīng)常有香客問我髓窜,道長,這世上最難降的妖魔是什么欺殿? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任寄纵,我火速辦了婚禮,結(jié)果婚禮上脖苏,老公的妹妹穿的比我還像新娘程拭。我一直安慰自己,他們只是感情好棍潘,可當(dāng)我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布恃鞋。 她就那樣靜靜地躺著,像睡著了一般亦歉。 火紅的嫁衣襯著肌膚如雪恤浪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天肴楷,我揣著相機(jī)與錄音水由,去河邊找鬼。 笑死赛蔫,一個胖子當(dāng)著我的面吹牛砂客,可吹牛的內(nèi)容都是我干的泥张。 我是一名探鬼主播,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼鞠值,長吁一口氣:“原來是場噩夢啊……” “哼媚创!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起彤恶,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤筝野,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后粤剧,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體歇竟,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年抵恋,在試婚紗的時候發(fā)現(xiàn)自己被綠了焕议。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡弧关,死狀恐怖盅安,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情世囊,我是刑警寧澤别瞭,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站株憾,受9級特大地震影響蝙寨,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜嗤瞎,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一墙歪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧贝奇,春花似錦虹菲、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至陕习,卻和暖如春霎褐,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背衡查。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工瘩欺, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓俱饿,卻偏偏與公主長得像歌粥,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子拍埠,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容

  • Python 2.7IDE Pycharm 5.0.3Firefox 47.0.1 豆瓣電影系列: 基礎(chǔ)抓取(限于...
    mrlevo520閱讀 2,833評論 6 31
  • 基本概念 在本章中棉圈,我們將介紹一個分布式版本控制系統(tǒng)的設(shè)計思路涩堤,以及它與集中式版本控制系統(tǒng)的不同之處。除此之外分瘾,我...
    Gh0stClub閱讀 419評論 0 1
  • 今天工作超量完成胎围,狀態(tài)一般,我自己要學(xué)習(xí)的東西也該抓緊德召,晚上回家暖氣不熱白魂,冰涼,放了兩桶水也沒見好轉(zhuǎn)上岗,看看明天怎么...
    兆之閱讀 126評論 0 0
  • 坐了一會馬車福荸,就到了皇宮大門,再往里走走肴掷,只見形形色色的人們在皇宮的清和苑進(jìn)進(jìn)出出敬锐,清和苑是皇宮專門布置宴會的地方...
    暮雪少白閱讀 577評論 0 0