第四次作業(yè):對微博關(guān)注中街舞分類下的內(nèi)容進行爬取

import requests

import json

import re

headers = {

'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Mobile Safari/537.36',

'cookie':'SSOLoginState=1560744529; ALF=1563336529; SCF=AvTBvMMmz0oZngGtGSQ33rN-nryQ4Lw-Q9ZgXAHOU7FKal63f2BX601Mw8qrS1TwAyGD7MSpzamSAeaYvhnUfmo.; SUB=_2A25wA2IBDeRhGeRP41US-CzKyjyIHXVTDA5JrDV6PUNbktAKLRfhkW1NU-rmoTDAZi6xmOJKcVSCgl64cCl4ftoR; SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WW8judAe5n2NqdgSI.PKq9S5JpX5KMhUgL.Fozp1hM01hzceK52dJLoIEnLxKMLBK.LB.qLxK.L1h5L12qLxKML1heL1-qLxK.L1-zLB.HjIgp4; SUHB=0tKbOEMSFuEDBK; MLOGIN=1; _T_WM=62613902799; WEIBOCN_FROM=1110005030; XSRF-TOKEN=53f153; M_WEIBOCN_PARAMS=lfid%3D1005052187382610%26luicode%3D20000174%26uicode%3D20000174'

}

url ='https://m.weibo.cn/feed/group?gid=4218621758638928&max_id='

def get_info(url,no):

res = requests.get(url, headers=headers)

#? print(res.text)

? ? json_data = json.loads(res.text)

#? ? print(json_data)

? ? statuses = json_data['data']['statuses']

for statusein statuses:

text = statuse['text']

#? ? ? ? new_text = re.sub('[a-zA-Z0-9\s<="_>:/.?]+','',text,re.S)

? ? ? ? new_text = re.sub('<(.*?)>', '', text, re.S)

print(new_text)

max_id = json_data['data']['max_id']

no = no +1

? ? ? ? if no <=5:

next_url ='https://m.weibo.cn/feed/group?gid=4218621758638928&max_id={}'.format(max_id)

get_info(next_url, no)

else:

pass

get_info(url,1)


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌召夹,老刑警劉巖缩多,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件尸折,死亡現(xiàn)場離奇詭異笋庄,居然都是意外死亡彤灶,警方通過查閱死者的電腦和手機旷太,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門展懈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人供璧,你說我怎么就攤上這事存崖。” “怎么了睡毒?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵来惧,是天一觀的道長。 經(jīng)常有香客問我演顾,道長供搀,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任钠至,我火速辦了婚禮葛虐,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘棉钧。我一直安慰自己屿脐,他們只是感情好,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布宪卿。 她就那樣靜靜地躺著的诵,像睡著了一般。 火紅的嫁衣襯著肌膚如雪佑钾。 梳的紋絲不亂的頭發(fā)上西疤,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天,我揣著相機與錄音休溶,去河邊找鬼瘪阁。 笑死,一個胖子當著我的面吹牛邮偎,可吹牛的內(nèi)容都是我干的管跺。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼禾进,長吁一口氣:“原來是場噩夢啊……” “哼豁跑!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起泻云,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤艇拍,失蹤者是張志新(化名)和其女友劉穎狐蜕,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體卸夕,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡层释,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了快集。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贡羔。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖个初,靈堂內(nèi)的尸體忽然破棺而出乖寒,到底是詐尸還是另有隱情,我是刑警寧澤院溺,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布楣嘁,位于F島的核電站,受9級特大地震影響珍逸,放射性物質(zhì)發(fā)生泄漏逐虚。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一谆膳、第九天 我趴在偏房一處隱蔽的房頂上張望痊班。 院中可真熱鬧,春花似錦摹量、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至祝迂,卻和暖如春睦尽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背型雳。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工当凡, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人纠俭。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓沿量,卻偏偏與公主長得像,于是被迫代替她去往敵國和親冤荆。 傳聞我的和親對象是個殘疾皇子朴则,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容