Matplotlib和Seaborn之集群圖

集群圖

在這節(jié)課坪稽,你見到了描繪數(shù)字變量和分類變量之間關(guān)系的很多方式曼玩。小提琴圖將分布描繪為密度曲線,箱線圖采用的是摘要形式窒百,將數(shù)量繪制為須線黍判。這些圖形的另一種替代方式是集群圖。和散點(diǎn)圖類似篙梢,每個(gè)數(shù)據(jù)點(diǎn)根據(jù)在兩個(gè)變量上的值確定在圖形中的位置顷帖。點(diǎn)放置在盡量接近真實(shí)值的位置,不允許有任何重疊現(xiàn)象渤滞,而不是像在正常散點(diǎn)圖中那樣隨機(jī)抖動(dòng)數(shù)據(jù)點(diǎn)贬墩。可以使用 seaborn 中的 swarmplot 函數(shù)創(chuàng)建集群圖妄呕,調(diào)用方式和 violinplotboxplot 差不多陶舞。

plt.figure(figsize = [12, 5])
base_color = sb.color_palette()[0]

# left plot: violin plot
plt.subplot(1, 3, 1)
ax1 = sb.violinplot(data = df, x = 'cat_var', y = 'num_var', color = base_color)

# center plot: box plot
plt.subplot(1, 3, 2)
sb.boxplot(data = df, x = 'cat_var', y = 'num_var', color = base_color)
plt.ylim(ax1.get_ylim()) # set y-axis limits to be same as left plot

# right plot: swarm plot
plt.subplot(1, 3, 3)
sb.swarmplot(data = df, x = 'cat_var', y = 'num_var', color = base_color)
plt.ylim(ax1.get_ylim()) # set y-axis limits to be same as left plot

image.png

并排地查看這些圖形后,可以看出集群圖的優(yōu)勢與不足绪励。和小提琴圖和箱線圖不同的是肿孵,每個(gè)點(diǎn)都繪制出來论咏,因此可以比較每個(gè)群組在同一圖形中的頻率。雖然由于位置抖動(dòng)而出現(xiàn)變形颁井,但是我們也可以確切地了解每個(gè)點(diǎn)實(shí)際位于何處厅贪,消除了小提琴圖中可能出現(xiàn)的長尾現(xiàn)象。

但是雅宾,只有數(shù)據(jù)量很少或適中時(shí)养涮,才適合使用集群圖。如果有太多的數(shù)據(jù)點(diǎn)眉抬,那么重疊限制將導(dǎo)致變形嚴(yán)重贯吓,或者需要很多空間才能很好地繪制數(shù)據(jù)。此外蜀变,數(shù)據(jù)點(diǎn)太多實(shí)際上會(huì)存在干擾悄谐,使我們更難發(fā)現(xiàn)圖形中的關(guān)鍵規(guī)律。請根據(jù)在單變量可視化部分得出的結(jié)論判斷哪個(gè)雙變量可視化圖形最合適库北,或者直接嘗試不同的圖形爬舰,看看哪個(gè)呈現(xiàn)的信息最多。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末寒瓦,一起剝皮案震驚了整個(gè)濱河市情屹,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌杂腰,老刑警劉巖垃你,帶你破解...
    沈念sama閱讀 212,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異喂很,居然都是意外死亡惜颇,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評論 3 385
  • 文/潘曉璐 我一進(jìn)店門少辣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凌摄,“玉大人,你說我怎么就攤上這事毒坛⊥祝” “怎么了林说?”我有些...
    開封第一講書人閱讀 158,369評論 0 348
  • 文/不壞的土叔 我叫張陵煎殷,是天一觀的道長。 經(jīng)常有香客問我腿箩,道長豪直,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,799評論 1 285
  • 正文 為了忘掉前任珠移,我火速辦了婚禮弓乙,結(jié)果婚禮上末融,老公的妹妹穿的比我還像新娘。我一直安慰自己暇韧,他們只是感情好勾习,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,910評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著懈玻,像睡著了一般巧婶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上涂乌,一...
    開封第一講書人閱讀 50,096評論 1 291
  • 那天艺栈,我揣著相機(jī)與錄音,去河邊找鬼湾盒。 笑死湿右,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的罚勾。 我是一名探鬼主播毅人,決...
    沈念sama閱讀 39,159評論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼尖殃!你這毒婦竟也來了耘成?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,917評論 0 268
  • 序言:老撾萬榮一對情侶失蹤嚼锄,失蹤者是張志新(化名)和其女友劉穎肩民,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蚪战,經(jīng)...
    沈念sama閱讀 44,360評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡牵现,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,673評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了邀桑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瞎疼。...
    茶點(diǎn)故事閱讀 38,814評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖壁畸,靈堂內(nèi)的尸體忽然破棺而出贼急,到底是詐尸還是另有隱情,我是刑警寧澤捏萍,帶...
    沈念sama閱讀 34,509評論 4 334
  • 正文 年R本政府宣布太抓,位于F島的核電站,受9級特大地震影響令杈,放射性物質(zhì)發(fā)生泄漏走敌。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,156評論 3 317
  • 文/蒙蒙 一逗噩、第九天 我趴在偏房一處隱蔽的房頂上張望掉丽。 院中可真熱鬧跌榔,春花似錦、人聲如沸捶障。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽项炼。三九已至皆辽,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間芥挣,已是汗流浹背驱闷。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留空免,地道東北人空另。 一個(gè)月前我還...
    沈念sama閱讀 46,641評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像蹋砚,于是被迫代替她去往敵國和親扼菠。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,728評論 2 351

推薦閱讀更多精彩內(nèi)容