2020-05-22:selenium 爬取微博熱搜榜單內(nèi)容顷锰,并分類存儲(chǔ)到文本文件

from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC

hots_content=''

with open("d:\weibo.txt", 'w')as f:

driver = webdriver.Chrome()

driver.get('https://m.weibo.cn/')

# 點(diǎn)擊“大家都在搜”

? ? driver.find_element_by_class_name('m-search').click()

time.sleep(1)

# 定位熱搜榜所在的大標(biāo)簽,使用了顯式等待

? ? hotlist_all = WebDriverWait(driver,5,0.5).until(EC.visibility_of_element_located((By.CLASS_NAME, "m-col-2")))

#hotlist_all2 = driver.find_element_by_class_name('m-col-2')

? ? # 找出熱搜榜大標(biāo)簽里的所有元素

? ? hoteles = hotlist_all.find_elements_by_class_name('m-item-box')

# 找到“微博熱搜榜”并點(diǎn)擊

? ? hotlist = hoteles[-1]

hotlist.click()

# 顯式等待精堕,定位實(shí)時(shí)熱點(diǎn)即寒,每分鐘刷新頁(yè)面部分

? ? all_hots = WebDriverWait(driver, 5, 0.5).until(EC.visibility_of_all_elements_located((By.CLASS_NAME, "card4")))

#all_hots = driver.find_elements_by_class_name('card4')

? ? for hotin all_hots:

# 獲取熱搜標(biāo)題

? ? ? ? hot_summary = hot.find_element_by_class_name('m-text-cut').text

# 獲取每條熱搜點(diǎn)擊率

? ? ? ? hot_click_amount = hot.find_element_by_xpath(

'//*[@id="app"]/div[1]/div[1]/div[2]/div/div/div[3]/div/div/div/div/span[2]/span[2]').text

icon = hot.find_elements_by_class_name("m-link-icon")

if icon:

img = icon[0].find_element_by_tag_name('img')

src = img.get_attribute('src')

if "hot" in src:

hottag ='熱'

? ? ? ? ? ? ? ? hots =f'{hot_summary, hot_click_amount, hottag}'

? ? ? ? ? ? ? ? print(hots)

hots_content += hots +'\n'

? ? ? ? ? ? elif "recom" in src:

hottag ='薦'

? ? ? ? ? ? ? ? hots =f'{hot_summary, hot_click_amount, hottag}'

? ? ? ? ? ? ? ? print(hots)

hots_content += hots +'\n'

? ? ? ? ? ? elif "new" in src:

hottag ='新'

? ? ? ? ? ? ? ? hots =f'{hot_summary, hot_click_amount, hottag}'

? ? ? ? ? ? ? ? print(hots)

hots_content += hots +'\n'

? ? ? ? ? ? elif "fei" in src:

hottag ='沸'

? ? ? ? ? ? ? ? hots =f'{hot_summary, hot_click_amount, hottag}'

? ? ? ? ? ? ? ? print(hots)

hots_content += hots +'\n'

? ? driver.quit()

f.write(hots_content)



最后打印結(jié)果:

('兩會(huì)2020', '1205575', '熱')

('建議將HPV疫苗納入國(guó)家免疫規(guī)劃', '1205575', '沸')

('中國(guó)不存在隱性軍費(fèi)問(wèn)題', '1205575', '新')

('清華學(xué)霸放棄保研成為女特種兵', '1205575', '沸')

('建議取消生育三孩以上處罰', '1205575', '沸')

('計(jì)劃今明兩年制定修改法律17部', '1205575', '新')

('建議離婚過(guò)錯(cuò)方少分或不分財(cái)產(chǎn)', '1205575', '沸')

('鄭愷苗苗結(jié)婚', '1205575', '沸')

('張寶艷建議保護(hù)離異家庭兒童親情權(quán)', '1205575', '新')

('民法典草案累計(jì)收到42.5萬(wàn)人102萬(wàn)條意見', '1205575', '新')

('張馳 溫婉', '1205575', '熱')

('孫耀威給老婆轉(zhuǎn)5201314元', '1205575', '熱')

('張藝興騎馬舞', '1205575', '新')

('程曉玥', '1205575', '熱')

('GAI方言RAP', '1205575', '新')

('俄女排名教將申請(qǐng)吉尼斯紀(jì)錄', '1205575', '新')

('老師改編量子力學(xué)版消愁', '1205575', '新')

('建議將欺詐發(fā)行罪最高刑提至無(wú)期', '1205575', '新')

('KPL常規(guī)賽收官大戰(zhàn)', '1205575', '新')

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末姨蟋,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子与殃,更是在濱河造成了極大的恐慌单山,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,284評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件幅疼,死亡現(xiàn)場(chǎng)離奇詭異米奸,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)爽篷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門悴晰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人逐工,你說(shuō)我怎么就攤上這事铡溪。” “怎么了泪喊?”我有些...
    開封第一講書人閱讀 164,614評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵佃却,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我窘俺,道長(zhǎng),這世上最難降的妖魔是什么复凳? 我笑而不...
    開封第一講書人閱讀 58,671評(píng)論 1 293
  • 正文 為了忘掉前任瘤泪,我火速辦了婚禮,結(jié)果婚禮上育八,老公的妹妹穿的比我還像新娘对途。我一直安慰自己,他們只是感情好髓棋,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,699評(píng)論 6 392
  • 文/花漫 我一把揭開白布实檀。 她就那樣靜靜地躺著惶洲,像睡著了一般。 火紅的嫁衣襯著肌膚如雪膳犹。 梳的紋絲不亂的頭發(fā)上恬吕,一...
    開封第一講書人閱讀 51,562評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音须床,去河邊找鬼铐料。 笑死,一個(gè)胖子當(dāng)著我的面吹牛豺旬,可吹牛的內(nèi)容都是我干的钠惩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,309評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼族阅,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼篓跛!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起坦刀,我...
    開封第一講書人閱讀 39,223評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤愧沟,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后求泰,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體央渣,經(jīng)...
    沈念sama閱讀 45,668評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,859評(píng)論 3 336
  • 正文 我和宋清朗相戀三年渴频,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了芽丹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,981評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡卜朗,死狀恐怖拔第,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情场钉,我是刑警寧澤蚊俺,帶...
    沈念sama閱讀 35,705評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站逛万,受9級(jí)特大地震影響泳猬,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜宇植,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,310評(píng)論 3 330
  • 文/蒙蒙 一得封、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧指郁,春花似錦忙上、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)茬斧。三九已至,卻和暖如春梗逮,著一層夾襖步出監(jiān)牢的瞬間项秉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工库糠, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留伙狐,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,146評(píng)論 3 370
  • 正文 我出身青樓瞬欧,卻偏偏與公主長(zhǎng)得像贷屎,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子艘虎,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,933評(píng)論 2 355