Python數(shù)據(jù)可視化(十):熱圖繪制

使用seaborn包繪制熱圖

# library
import seaborn as sns
import pandas as pd
import numpy as np

# Create a dataset
df = pd.DataFrame(np.random.random((5,5)), columns=["a","b","c","d","e"])
df.head()
a b c d e
0 0.285442 0.951543 0.685812 0.924632 0.309812
1 0.358051 0.686573 0.286615 0.571409 0.224154
2 0.404226 0.489562 0.848711 0.490436 0.777601
3 0.244537 0.015112 0.253332 0.405353 0.482515
4 0.648074 0.593299 0.788003 0.731065 0.197049
# Default heatmap: just a visualization of this square matrix
sns.heatmap(df)
image.png
# Create a dataset
df = pd.DataFrame(np.random.random((100,5)), columns=["a","b","c","d","e"])

# Calculate correlation between each pair of variable
# 計算相關(guān)性矩陣
corr_matrix=df.corr()
corr_matrix.head()
a b c d e
a 1.000000 0.159442 0.124977 0.006820 -0.164380
b 0.159442 1.000000 0.204697 0.128948 -0.152218
c 0.124977 0.204697 1.000000 0.013078 -0.210332
d 0.006820 0.128948 0.013078 1.000000 -0.066149
e -0.164380 -0.152218 -0.210332 -0.066149 1.000000
# plot it
# 設(shè)置cmap參數(shù)更改熱圖顏色
sns.heatmap(corr_matrix, cmap='PuOr')
image.png
# Create a dataset
df = pd.DataFrame(np.random.random((10,10)), columns=["a","b","c","d","e","f","g","h","i","j"])

# plot a heatmap with annotation
# 設(shè)置annot=True參數(shù)添加文本注釋
sns.heatmap(df, annot=True, annot_kws={"size": 7})
image.png
# plot a heatmap with custom grid lines
# 設(shè)置linewidths和linecolor參數(shù)更改熱圖邊框線的寬度和顏色
sns.heatmap(df, linewidths=2, linecolor='yellow')
image.png
# plot a heatmap
# 設(shè)置yticklabels=False參數(shù)去掉y軸標簽
sns.heatmap(df, yticklabels=False)
image.png
# plot a heatmap
# 設(shè)置cbar=False參數(shù)去掉圖例
sns.heatmap(df, cbar=False) 
image.png
# color bar range between 0 and 0.5
# 設(shè)置vmin和vmax參數(shù)更改圖例范圍
sns.heatmap(df, cmap="YlGnBu", vmin=0, vmax=0.5)
image.png
# Normalize it by row:
# 對數(shù)據(jù)按行進行歸一化
df_norm_row = df.apply(lambda x: (x-x.mean())/x.std(), axis = 1)
df_norm_row.head()
a b c d e f g h i j
0 -0.269670 0.382143 -1.460830 1.402933 -0.833766 -0.245428 -1.278216 1.171598 0.937957 0.193277
1 0.474720 0.890045 -0.607959 0.143930 -1.703700 -0.907119 0.459649 1.476858 0.737861 -0.964285
2 -0.848842 1.051811 -0.548000 0.835517 1.096437 -0.535326 -0.951875 -0.831628 1.553493 -0.821587
3 0.095071 -1.127515 -0.090492 0.081681 -0.071626 -1.829757 -0.412118 1.650594 0.903475 0.800687
4 1.600482 -0.628712 -0.322168 -0.625308 0.041427 1.357510 -0.904758 -1.389798 0.971431 -0.100107
# And see the result
sns.heatmap(df_norm_row, cmap='viridis')
image.png
# Now if we normalize it by column:
# 對數(shù)據(jù)按列進行歸一化
df_norm_col=(df-df.mean())/df.std()

sns.heatmap(df_norm_col, cmap='viridis')
image.png

對熱圖添加聚類樹

# Libraries
import seaborn as sns
import pandas as pd
from matplotlib import pyplot as plt

# Data set
url = 'c:/Users/Dell/Downloads/mtcars.csv'
df = pd.read_csv(url,index_col=0)
df.head()
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
# Default plot
sns.clustermap(df)
# Show the graph
plt.show()
image.png
# 進行數(shù)據(jù)歸一化
# Standardize or Normalize every column in the figure
# Standardize:
sns.clustermap(df, standard_scale=1)
plt.show()
image.png
# Normalize
sns.clustermap(df, z_score=1)
plt.show()
image.png
# 設(shè)置不同的距離計算方法
# plot with correlation distance
sns.clustermap(df, metric="correlation", standard_scale=1, cmap="PiYG")
plt.show()
image.png
# plot with euclidean distance
sns.clustermap(df, metric="euclidean", standard_scale=1, cmap="PiYG")
plt.show()
image.png
# 設(shè)置不同的聚類方法
# linkage method to use for calculating clusters: single
sns.clustermap(df, metric="euclidean", standard_scale=1, method="single", cmap = "Blues")
plt.show()
image.png

In [38]:

# linkage method to use for calculating clusters: ward
sns.clustermap(df, metric="euclidean", standard_scale=1, method="ward", cmap = "Blues")
plt.show()
image.png
# 更改不同的熱圖顏色
# Change color palette
sns.clustermap(df, metric="euclidean", standard_scale=1, method="ward", cmap="mako")
plt.show()
image.png
sns.clustermap(df, metric="euclidean", standard_scale=1, method="ward", cmap="viridis")
plt.show()
image.png
# 添加行注釋信息
# Prepare a vector of color mapped to the 'cyl' column
my_palette = dict(zip(df.cyl.unique(), ["orange","yellow","brown"]))
row_colors = df.cyl.map(my_palette)
row_colors
Mazda RX4              orange
Mazda RX4 Wag          orange
Datsun 710             yellow
Hornet 4 Drive         orange
Hornet Sportabout       brown
Valiant                orange
Duster 360              brown
Merc 240D              yellow
Merc 230               yellow
Merc 280               orange
Merc 280C              orange
Merc 450SE              brown
Merc 450SL              brown
Merc 450SLC             brown
Cadillac Fleetwood      brown
Lincoln Continental     brown
Chrysler Imperial       brown
Fiat 128               yellow
Honda Civic            yellow
Toyota Corolla         yellow
Toyota Corona          yellow
Dodge Challenger        brown
AMC Javelin             brown
Camaro Z28              brown
Pontiac Firebird        brown
Fiat X1-9              yellow
Porsche 914-2          yellow
Lotus Europa           yellow
Ford Pantera L          brown
Ferrari Dino           orange
Maserati Bora           brown
Volvo 142E             yellow
Name: cyl, dtype: object</pre>
# plot
sns.clustermap(df, metric="correlation", method="single", cmap="Blues", standard_scale=1, row_colors=row_colors)
plt.show()
image.png

原文鏈接:https://www.python-graph-gallery.com/heatmap/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市申鱼,隨后出現(xiàn)的幾起案子云头,更是在濱河造成了極大的恐慌,老刑警劉巖溃槐,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件昏滴,死亡現(xiàn)場離奇詭異,居然都是意外死亡谣殊,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門宜狐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛇捌,“玉大人,你說我怎么就攤上這事俭驮〈好常” “怎么了遗遵?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵譬圣,是天一觀的道長。 經(jīng)常有香客問我屯蹦,道長绳姨,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任脑蠕,我火速辦了婚禮跪削,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘碾盐。我一直安慰自己谜叹,他們只是感情好狸剃,可當我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布烹玉。 她就那樣靜靜地躺著阐滩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪掂榔。 梳的紋絲不亂的頭發(fā)上衅疙,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天,我揣著相機與錄音饱溢,去河邊找鬼。 笑死潘鲫,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的挖函。 我是一名探鬼主播浊竟,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼必怜!你這毒婦竟也來了后频?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤膏执,失蹤者是張志新(化名)和其女友劉穎露久,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體抱环,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡镇草,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年瘤旨,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片因宇。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡祟偷,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出修肠,到底是詐尸還是另有隱情,我是刑警寧澤饲化,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站硫眨,受9級特大地震影響巢块,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜族奢,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一歹鱼、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧弥姻,春花似錦、人聲如沸疼进。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽嚼锄。三九已至,卻和暖如春区丑,著一層夾襖步出監(jiān)牢的瞬間修陡,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工宴杀, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留拾因,地道東北人斯棒。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓主经,卻偏偏與公主長得像,于是被迫代替她去往敵國和親穗酥。 傳聞我的和親對象是個殘疾皇子惠遏,可洞房花燭夜當晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內(nèi)容

  • 前言 使用 pheatmap 已經(jīng)能夠繪制滿足大多數(shù)要求的聚類熱圖了。 受 pheatmap 包的啟發(fā)抽高,Compl...
    名本無名閱讀 42,309評論 8 75
  • 表情是什么透绩,我認為表情就是表現(xiàn)出來的情緒。表情可以傳達很多信息碳竟。高興了當然就笑了狸臣,難過就哭了。兩者是相互影響密不可...
    Persistenc_6aea閱讀 124,459評論 2 7
  • 16宿命:用概率思維提高你的勝算 以前的我是風險厭惡者烛亦,不喜歡去冒險,但是人生放棄了冒險铐达,也就放棄了無數(shù)的可能呜师。 ...
    yichen大刀閱讀 6,041評論 0 4