# -*- coding:utf-8 -*-
import requests
import re
import time
class weibo():
def __init__(self):
self.weibo = []
def get_page1(self, url):
cookies = {}
cookie = 'SINAGLOBAL=2777936565689.7427.1466425410359; wb_bub_hot_1860241872=1; wb_g_minivideo_1860241872=1; SSOLoginState=1467537363; YF-Ugrow-G0=b02489d329584fca03ad6347fc915997; YF-V5-G0=b188043973f8ae1849ba6cd9ae007290; _s_tentry=-; Apache=7162702707573.771.1467538108120; ULV=1467538108217:14:3:1:7162702707573.771.1467538108120:1467373335174; YF-Page-G0=3d55e26bde550ac7b0d32a2ad7d6fa53; WBStore=8ca40a3ef06ad7b2|undefined; un=582602426@qq.com; wvr=6; gsid_CTandWM=4ubUCpOz5xZW3mcuHYb0I7NVTe4; SCF=AsG32LL5L-tXhp-r1nkoX4WKVRR90O-T9ecxTNXSsvXewAtX4tSPpWx4_jfwlYNTuRw6BS9oxKaK4muBwsqe3PQ.; SUB=_2A256f6BfDeTxGedG7VIT9C_EzD6IHXVZDJaXrDV8PUJbmtBeLRCikW8XOCjEMbO9_BI_WqTmNAYyV6Avlg..; SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WFMl0_0K_GpCB8HR3kxdz7m5JpX5o2p5NHD95Qp1hq7eoBp1hMEWs4DqcjHi--ci-zfi-24i--ciKnRiK.7KsLV; SUHB=05iLVRXO83IiPd; UOR=,,link.zhihu.com'
for line in cookie.split(';'):
#其設(shè)置為1就會(huì)把字符串拆分成2份
name,value=line.strip().split('=',1)
cookies[name]=value
html = requests.get(url, cookies = cookies).text
#f.write(html.text.encode('utf-8'))
xunliehaos = re.findall(r'\w+-\w+-\w+-\w+', html, re.S)
for i in xunliehaos:
self.weibo.append(i)
def get_page2(self, url):
cookies = {}
cookie = 'SINAGLOBAL=2777936565689.7427.1466425410359; wb_bub_hot_1860241872=1; wb_g_minivideo_1860241872=1; SSOLoginState=1467537363; YF-Ugrow-G0=b02489d329584fca03ad6347fc915997; YF-V5-G0=b188043973f8ae1849ba6cd9ae007290; _s_tentry=-; Apache=7162702707573.771.1467538108120; ULV=1467538108217:14:3:1:7162702707573.771.1467538108120:1467373335174; YF-Page-G0=3d55e26bde550ac7b0d32a2ad7d6fa53; WBStore=8ca40a3ef06ad7b2|undefined; un=582602426@qq.com; wvr=6; gsid_CTandWM=4ubUCpOz5xZW3mcuHYb0I7NVTe4; SCF=AsG32LL5L-tXhp-r1nkoX4WKVRR90O-T9ecxTNXSsvXewAtX4tSPpWx4_jfwlYNTuRw6BS9oxKaK4muBwsqe3PQ.; SUB=_2A256f6BfDeTxGedG7VIT9C_EzD6IHXVZDJaXrDV8PUJbmtBeLRCikW8XOCjEMbO9_BI_WqTmNAYyV6Avlg..; SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WFMl0_0K_GpCB8HR3kxdz7m5JpX5o2p5NHD95Qp1hq7eoBp1hMEWs4DqcjHi--ci-zfi-24i--ciKnRiK.7KsLV; SUHB=05iLVRXO83IiPd; UOR=,,link.zhihu.com'
for line in cookie.split(';'):
#其設(shè)置為1就會(huì)把字符串拆分成2份
name,value=line.strip().split('=',1)
cookies[name]=value
html1 = requests.get(url, cookies = cookies).text
new = re.findall(r'\w+-\w+-\w+-\w+', html1, re.S)[1]
if new not in self.weibo:
print new
url = 'http://weibo.com/p/1005051860241872/home?from=page_100505_profile&wvr=6&mod=data&is_all=1'
weib = weibo()
while 1:
weib.get_page1(url)
time.sleep(15)
weib.get_page2(url)
爬微博序列號(hào)
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)起便,“玉大人棚贾,你說(shuō)我怎么就攤上這事∮” “怎么了鸟悴?”我有些...
- 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)奖年。 經(jīng)常有香客問(wèn)我细诸,道長(zhǎng),這世上最難降的妖魔是什么陋守? 我笑而不...
- 正文 為了忘掉前任震贵,我火速辦了婚禮利赋,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘猩系。我一直安慰自己媚送,他們只是感情好,可當(dāng)我...
- 文/花漫 我一把揭開(kāi)白布寇甸。 她就那樣靜靜地躺著塘偎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪拿霉。 梳的紋絲不亂的頭發(fā)上吟秩,一...
- 那天,我揣著相機(jī)與錄音绽淘,去河邊找鬼涵防。 笑死,一個(gè)胖子當(dāng)著我的面吹牛沪铭,可吹牛的內(nèi)容都是我干的壮池。 我是一名探鬼主播,決...
- 文/蒼蘭香墨 我猛地睜開(kāi)眼杀怠,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼椰憋!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起驮肉,我...
- 序言:老撾萬(wàn)榮一對(duì)情侶失蹤熏矿,失蹤者是張志新(化名)和其女友劉穎已骇,沒(méi)想到半個(gè)月后离钝,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
- 正文 獨(dú)居荒郊野嶺守林人離奇死亡褪储,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
- 正文 我和宋清朗相戀三年卵渴,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鲤竹。...
- 正文 年R本政府宣布吱肌,位于F島的核電站痘拆,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏氮墨。R本人自食惡果不足惜纺蛆,卻給世界環(huán)境...
- 文/蒙蒙 一吐葵、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧桥氏,春花似錦温峭、人聲如沸。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至堕伪,卻和暖如春清笨,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背刃跛。 一陣腳步聲響...
- 正文 我出身青樓检号,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親蛙酪。 傳聞我的和親對(duì)象是個(gè)殘疾皇子齐苛,可洞房花燭夜當(dāng)晚...
推薦閱讀更多精彩內(nèi)容
- 一、回顧 我們之前利用Scrapy爬取豆瓣網(wǎng)站信息時(shí)桂塞,直接通過(guò)加載目標(biāo)URL返回的Response得到想要的值凹蜂。我...
- 隨著公司的并行項(xiàng)目越來(lái)越多,Android新項(xiàng)目初始化的變成一個(gè)問(wèn)題阁危,一開(kāi)始是每個(gè)人建立項(xiàng)目不一樣玛痊,為此設(shè)計(jì)了清單...
- 昨天給姥姥收拾舊物,找到好多以前勾毛衣的線狂打。突發(fā)奇想用初中時(shí)勾圍巾的方法給自己勾了一個(gè)手機(jī)包擂煞。
- 三明治蒿涎、漢堡神馬的在速食界似乎要過(guò)時(shí)了呢!像我這樣對(duì)美食有極高要求的吃貨惦辛,才不要吃那么不健康的速食劳秋。飯團(tuán)就不一樣了...