接著上次的分布圖繼續(xù)總結
一转晰、目錄:
分布圖
- displot (直方圖)
- kedplot(概率密度圖)
- jointplot(聯(lián)合密度圖)
- pairplot(多變量圖)
分類圖
- boxplot(箱線圖)
- violinplot(提琴圖)
回歸圖
- lmplot (回歸圖)
矩陣圖
- heatmap (熱力圖)
二违孝、分類圖
2.1淘钟、boxplot(箱線圖)
箱線圖是用來表示跨類別變量之間的定量數據的分布情況缩举●框體表示上下四分位數磨总、線顯示分布的其余部分挟炬,中間線表示的是中位數焰络,在線外的則為離群值(異常數據)戴甩。具體參數為:
seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None,
hue_order=None, orient=None, color=None, palette=None, saturation=0.75,
width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)
- data:數據集
- x:數據集中哪一列數據作為x軸的分類變量
- y:數據變量
- hue:分類
- saturation:float,飽和度
- width:float闪彼,控制箱型圖的寬度
- fliersize:float甜孤,用于指示離群值觀察標記大小
區(qū)分不同區(qū)的房屋面積
用hue進行分類
2.2协饲、提琴圖
提琴圖與箱線圖類似,都是用來表示不同類別數據之間定量數據的分布情況缴川。但是提琴圖的繪圖基礎是密度圖茉稠,通過提琴圖可以知道定量數據的分布情況。在圖中把夸,白點是中位數而线,黑色盒型的范圍是下四分位數到上四分位數,細黑線表示須恋日。外部形狀為密度分布曲線膀篮。
seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None,
hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100,
width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None,
color=None, palette=None, saturation=0.75, ax=None, **kwargs)
- data,x,y,hue:含義同上
- bw:‘scott’, ‘silverman’, float,控制擬合程度岂膳。在計算內核帶寬時誓竿,可以引用規(guī)則的名稱(‘scott’, ‘silverman’)或者使用比例(float)。實際內核大小將通過將比例乘以每個bin內數據的標準差來確定
- scale:“area”谈截,“count”筷屡,“width”,用來縮放每個提琴圖的寬度的方法簸喂。
*scale_hue:當使用hue分類后毙死,設置為True時,此參數確定是否在主分組變量進行縮放 - gridsize:設置提琴圖平滑度喻鳄,越高越平滑
- inner:“box”, “quartile”, “point”, “stick”, None,小提琴內部數據點的表示扼倘。分別表示:箱子,四分位诽表,點唉锌,數據線和不表示;
- split:是否拆分竿奏,與hue的分類結合使用
默認情況
根據hue分類進行split袄简,并根據count計數來畫概率分布