本文主要講述如何通過pandas對爬蟲下來的鏈家數(shù)據(jù)進(jìn)行相應(yīng)的二手房數(shù)據(jù)分析谦去,主要分析內(nèi)容包括各個(gè)區(qū)攒巍,各個(gè)小區(qū)的房源信息情況
推薦下我自己創(chuàng)建的Python學(xué)習(xí)交流群960410445,這是Python學(xué)習(xí)交流的地方羊瘩,不管你是小白還是大牛泰佳,小編都?xì)g迎,不定期分享干貨尘吗,包括我整理的一份適合零基礎(chǔ)學(xué)習(xí)Python的資料和入門教程逝她。
然后查看是否有數(shù)據(jù)
#獲取總價(jià)格全五的數(shù)據(jù)
house.sort_values('totalprice',ascending=False).head(5)
字符串的處理
接下來我來計(jì)算所有戶型的個(gè)數(shù),然后用圖像展示出來
#計(jì)算戶型的所占的個(gè)數(shù)睬捶,用到value_counts(),排序也給你做好了黔宛,你可以清楚的看到所占的個(gè)數(shù)
housetype = house['housetype'].value_counts()
結(jié)果
有于matplotlib不顯示中文我在網(wǎng)上查了些資料,得到的解決方案就是加兩行代碼
圖像展示結(jié)果,有圖像可以清楚的看到數(shù)量分布情況
結(jié)果
圖像展示
戶型與看房次數(shù)
在售面積分布
#如有錯(cuò)誤請指出武鲁,謝謝喉祭!