2018 年的開始就被娛樂圈李小璐事件刷爆網(wǎng)絡(luò)趴捅,對于這件事我們用數(shù)據(jù)說話羔味。我們就運用 Python,來看看各大媒體蛆橡,是怎么談論這個事情的侧但,運用 Python 抓取新浪微博,根據(jù)關(guān)鍵字“李小璐 PGONE”航罗,能夠搜索到700 條熱門微博(這個并非一切的,而是當前新浪微博可查詢的)屁药。
下面我們來看新浪微博媒體發(fā)布數(shù)據(jù)截圖
熱門微博生成的詞云
從詞云中粥血,我們能夠看出,這個事件中酿箭,涉及到的人物有李小璐复亏、PGONE、賈乃亮缭嫡、王思聰缔御、卓偉、馬蘇妇蛀,其中耕突,最無辜的是李小冉同學笤成,由于姓名相似,也被網(wǎng)友火熱光臨了一把眷茁。
涉及的人物詞頻
李小璐回復該事件的微博
直接抓取轉(zhuǎn)發(fā)的 4.5 萬用戶談論炕泳,然后計算詞頻繪制詞云,如下圖所示:
網(wǎng)友談論詞云
能夠看到上祈,網(wǎng)友們的態(tài)度主要是會集在厭惡培遵、出軌以及相信、喜愛這兩種態(tài)度上登刺,但是呢籽腕,在網(wǎng)友的詞頻里面,竟然很少提及到 PGONE纸俭,也就是說皇耗,在李小璐的微博下面,我們都是在討論李小璐和賈乃亮的愛情啊掉蔬。
下面給大家講一個利用 Python實現(xiàn)新浪微博爬蟲的例子廊宪。第一個模塊,模擬登陸 sina 微博女轿,創(chuàng)建 weiboLogin.py 文件箭启,輸入以下代碼:
image
就分享到這個。
Python開發(fā)
原文鏈接:http://t.cn/RHkrlkW