數(shù)據(jù)可視化寺旺,可視化的目的爷抓,是為了更直觀的理解數(shù)據(jù)、更快速的理解數(shù)據(jù)
單一圖表
- 直方圖
又稱質(zhì)量分布圖阻塑,可以直觀的展示每個屬性的分布情況
axes = df.hist(figsize=(9,9))
- 密度圖
也叫做KDE圖蓝撇,是一種表現(xiàn)與數(shù)據(jù)值對應的邊界或域?qū)ο蟮膱D形表示方法,一般用于呈現(xiàn)連續(xù)變量陈莽。
密度圖渤昌,類似于對直方圖的抽象,用平滑的曲線來描述數(shù)據(jù)分布走搁。
df.plot.kde(subplots=True, layout=(3,3) , sharex=False , figsize=(9,9))
相比較于直方圖独柑,密度圖,不需要去考慮分組數(shù)量私植,可以更好的繪制數(shù)據(jù)的分布形狀
- 箱線圖
又稱盒須圖忌栅、箱形圖,用來表現(xiàn)數(shù)據(jù)的分散情況
## 盒須圖
df.plot.box(subplots=True, layout=(3,3) , sharex=False,figsize=(9,9))