用python對鹿晗微博進行數據分析

轉載請注明地址:用python對鹿晗微博進行數據分析
這篇文章主要對數據進行簡單的分析,代碼在這里:
python利用pandas、matplotlib和wordcloud做數據分析

  • 準備分析的數據:
    |----評論者的微博昵稱
    |----微博的評論
    |----評論者的性別
    |----評論者的所在地
    |----評論者的生日

這次的數據準備了30萬+評論,其中不重復用戶14萬+。數據只是簡單的進行了簡單的去重和缺失值處理,感覺不用特別精確也能看出結果。這次的分析不是最終的結果近弟,只是可以參考的一個趨勢

用戶分析

  • 首先來看看評論最多的前幾名


  • 我的天,一個人一條微博評論800+挺智,這是不用吃飯嗎西壮。与纽。勤庐。

  • 不知道前三十里面是不是全是真愛啊迫摔!


  • 再來看看評論數的折線圖


  • 感覺在平穩(wěn)的折線取值分析比較靠譜,所以放大了看看泥从。
  • 14萬數據句占,出現一人幾百條的也就那幾個,所以把他們篩選掉躯嫉。


  • 在1000左右纱烘,人均的評論數差不多在20左右,才感覺不會是刷出來的祈餐。

  • 再看看性別擂啥,毫無疑問的。


  • 感覺這個結果還算正常帆阳,比計算機專業(yè)男女比大一點哺壶。

  • 之后再來說年齡分布


  • 由于微博默認生日的原因,有好幾個突出點蜒谤,可以忽略山宾,我也把范圍截取到了1949年-2017年。
  • 90后的峰值我預料到了鳍徽,但是沒想到00后會降的這么明顯资锰。難道真的都喜歡TF?本來想在爬一下TF的看看阶祭,不過感覺大同小異就沒有再做绷杜。
  • 之后看看具體排名吧:


  • 第一是98年的同學,不過前幾名差距不是很大濒募,可能跟采集的數據有關系鞭盟。
  • 可以看出來00后只有 00、01瑰剃、02在堅守陣地了齿诉。
  • 90后真的老了嗎。培他。鹃两。遗座。舀凛。

  • 最后來看看地區(qū)分析吧


  • 先來看看省份和四個直轄市分布,北京第一途蒋,有一點可能好多人都改成了和鹿晗一樣的東城區(qū)猛遍。。。所以可能不是很準確懊烤。
  • 其次是廣東梯醒,不知道為什么,好多刷量小號默認位置也是廣東腌紧,不知是不是這個原因和北京并列茸习。
  • 河北排在了第9。壁肋。号胚。

再來看看城市分布

  • 海淀區(qū)居然是第一,這個沒有想到浸遗。
  • 基本上分三個梯隊吧猫胁,石家莊在第三梯隊。
  • 很尷尬的是跛锌,分詞的時候把大連給分了弃秆?

最后看看整體城市分布比例吧,感覺石家莊有點小啊髓帽。



評論分析

  • 從詞云上可以看出來菠赚,評論中出現最多的詞是鹿晗,這點并不意外郑藏。
  • 其次锈至,音樂,愛译秦,零界點峡捡,棒棒糖等詞也排在前面,我想是因為這次爬取得微博是棒棒糖那篇筑悴。
  • 另外中間右部们拙,迪麗也出現了,可能八卦的網友也不少啊阁吝。
  • 整體感覺比較正能量砚婆,黑粉還是要少的多。

整體分析差不多就這樣了突勇,第一個項目做的有點慢装盯,下次計劃分析一下淘寶的商品信息,不過爬數據要花時間甲馋,可能會很久了埂奈。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市定躏,隨后出現的幾起案子账磺,更是在濱河造成了極大的恐慌芹敌,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件垮抗,死亡現場離奇詭異氏捞,居然都是意外死亡,警方通過查閱死者的電腦和手機冒版,發(fā)現死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進店門液茎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人辞嗡,你說我怎么就攤上這事豁护。” “怎么了欲间?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵楚里,是天一觀的道長。 經常有香客問我猎贴,道長班缎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任她渴,我火速辦了婚禮达址,結果婚禮上,老公的妹妹穿的比我還像新娘趁耗。我一直安慰自己沉唠,他們只是感情好,可當我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布苛败。 她就那樣靜靜地躺著满葛,像睡著了一般。 火紅的嫁衣襯著肌膚如雪罢屈。 梳的紋絲不亂的頭發(fā)上嘀韧,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天,我揣著相機與錄音缠捌,去河邊找鬼锄贷。 笑死,一個胖子當著我的面吹牛曼月,可吹牛的內容都是我干的谊却。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼哑芹,長吁一口氣:“原來是場噩夢啊……” “哼炎辨!你這毒婦竟也來了?” 一聲冷哼從身側響起绩衷,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤蹦魔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后咳燕,有當地人在樹林里發(fā)現了一具尸體勿决,經...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年招盲,在試婚紗的時候發(fā)現自己被綠了低缩。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡曹货,死狀恐怖咆繁,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情顶籽,我是刑警寧澤玩般,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站礼饱,受9級特大地震影響坏为,放射性物質發(fā)生泄漏。R本人自食惡果不足惜镊绪,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一匀伏、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蝴韭,春花似錦够颠、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至庆尘,卻和暖如春蹬耘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背减余。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工综苔, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人位岔。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓如筛,卻偏偏與公主長得像,于是被迫代替她去往敵國和親抒抬。 傳聞我的和親對象是個殘疾皇子杨刨,可洞房花燭夜當晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內容