R學(xué)習(xí)筆記(2):用pheatmap畫個(gè)熱圖

  1. 安裝pheatmap包
  2. 創(chuàng)建測(cè)試矩陣
  3. 畫個(gè)熱圖
  4. 顯示色塊的數(shù)值或文本
  5. 調(diào)整色塊或文本大小
  6. 行列注釋
  7. 列名的文本角度調(diào)整
  8. 切分熱圖
  9. 自定義顯示哪些行列的名字
  10. 用距離矩陣的方法來聚類
  11. 練習(xí)
1. 安裝pheatmap包
install.packages("pheatmap")
library(pheatmap)
2. 創(chuàng)建測(cè)試矩陣
test = matrix(rnorm(200), 20, 10) #test為一個(gè)20*10的矩陣,200個(gè)元素滿足參數(shù)為0和1的正態(tài)分布
test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 3
test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2
test[15:20, seq(2, 10, 2)] = test[15:20, seq(2, 10, 2)] + 4
colnames(test) = paste("Test", 1:10, sep = "") #定義列名,注意paste的用法
rownames(test) = paste("Gene", 1:20, sep = "") #定義行名
3. 畫個(gè)熱圖
3.1 pheatmap(test)

基本用法降铸,根據(jù)“2. 創(chuàng)建測(cè)試矩陣”中的局部賦值運(yùn)算可以得到明顯的分區(qū)。

3.2 pheatmap(test, kmeans_k = 3)

將行聚為幾類

kmeans是一種聚類算法谢鹊,詳見https://www.cnblogs.com/bourneli/p/3645049.html

3.3 pheatmap(test, scale = "row")

標(biāo)準(zhǔn)化

為什么要標(biāo)準(zhǔn)化镜硕? 原始數(shù)據(jù)中闻妓,每個(gè)基因表達(dá)變化范圍對(duì)應(yīng)的數(shù)值大小不同睦优,導(dǎo)致圖片中色彩變化難以顯示基因在不同樣本中的變化趨勢(shì)渗常,可以對(duì)基因在每個(gè)樣本中基因表達(dá)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,使其數(shù)值在一定范圍內(nèi)汗盘,從而實(shí)現(xiàn)熱圖的優(yōu)化皱碘,而控制參數(shù)為scale,對(duì)基因(行隐孽,row)進(jìn)行處理

可以與第一張圖比較一下癌椿,例如Gene3這一行,在這張圖中可以看出樣本之間的差異明顯了許多缓醋。

3.4 pheatmap(test, clustering_distance_rows = "correlation")

聚類線長(zhǎng)度優(yōu)化如失,可能不一樣的算法有不一樣的枝長(zhǎng)绊诲。
clustering_distance_cols同理送粱。

3.5 pheatmap(test, color = colorRampPalette(c("navy", "white", "firebrick3"))(10))

設(shè)置顏色,后面括號(hào)里的數(shù)字表示梯度掂之,10就是將這三種顏色設(shè)置為10個(gè)梯度

3.6 pheatmap(test, cluster_row = FALSE)

是否顯示行的聚類抗俄,cluster_col同理

3.7 pheatmap(test, legend = FALSE)

是否顯示圖例

4. 顯示色塊的數(shù)值或文本

基本用法:pheatmap(test, display_numbers = TRUE)
此外還可添加如下參數(shù)
number_format = "%.3e"表示保留3位小數(shù),且用科學(xué)計(jì)數(shù)法顯示
number_format = "%.3f"表示保留3位小數(shù)世舰,用小數(shù)顯示

display_numbers除了賦布爾值动雹,還能賦矩陣(其維度與原矩陣相同),此時(shí)可以人為添加文本(有點(diǎn)像R畫圖的圖層疊加)跟压。

pheatmap(test, display_numbers = matrix(ifelse(test > 5, "*", ""), 20,10))

legend_breaks設(shè)置圖例的顯示范圍胰蝠,間隔為1;legend_labels重寫刻度的標(biāo)簽, 需與legend_breaks同時(shí)使用震蒋。
pheatmap(test, legend_breaks = -1:4, legend_labels = c("0","1e-4", "1e-3", "1e-2", "1e-1", "1"))

5. 調(diào)整色塊或文本大小
pheatmap(test, cellwidth = 15, cellheight = 12, main = "Example heatmap", fontsize = 8, filename = "test.pdf")
dev.off()

這五個(gè)參數(shù)分別表示:
色塊的寬度茸塞、色塊的高度、標(biāo)題查剖、行列名及圖例字體的大小钾虐、保存為當(dāng)前工作目錄下的圖片的文件名

6. 行列注釋

對(duì)于每一行每一列都添加一些注釋信息,本質(zhì)還是"分類"笋庄。

annotation_col = data.frame(
  CellType = factor(rep(c("CT1", "CT2"), 5)), 
  Time = 1:5
) #注意rep()的用法效扫;為什么要定義為因子倔监;R可以自動(dòng)補(bǔ)全Time變量
rownames(annotation_col) = paste("Test", 1:10, sep = "")

annotation_row = data.frame(
  GeneClass = factor(rep(c("Path1", "Path2", "Path3"), c(10, 4, 6)))
)
rownames(annotation_row) = paste("Gene", 1:20, sep = "")

> annotation_col
       CellType Time
Test1       CT1    1
Test2       CT2    2
Test3       CT1    3
Test4       CT2    4
Test5       CT1    5

> annotation_row
       GeneClass
Gene1      Path1
Gene2      Path1
Gene3      Path1
Gene4      Path1
Gene5      Path1

在實(shí)際操作中,這些數(shù)據(jù)框表示的信息需要我們自己記錄菌仁。

pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row)

自定義注釋色塊的顏色

ann_colors = list(
  Time = c("white", "firebrick"),
  CellType = c(CT1 = "#1B9E77", CT2 = "#D95F02"),
  GeneClass = c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 = "#66A61E")
) #注意ann_colors是列表

pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row, 
         annotation_colors = ann_colors)
7. 列名的文本角度調(diào)整

angle_col = "45"浩习,文本與從左向右水平線的夾角,只能是“270”, “0”, “45”, “90”, “315”這幾個(gè)值济丘。

8. 切分熱圖
pheatmap(test, cluster_rows = F, gaps_row = c(10, 14), cluster_cols = T,
         cutree_col = 4)

gaps_row有效的前提是cluster_rows = F瘦锹;cutree_col有效的前提是cluster_cols = T
效果圖如下:

9. 自定義顯示哪些行列的名字
labels_row = c("", "", "", "", "", "", "", "", "", "", "", "", "", "", "", 
               "", "", "Il10", "Il15", "Il1b")

pheatmap(test, labels_row = labels_row)
10. 用距離矩陣的方法來聚類

?dist()
This function computes and returns the distance matrix computed by using the specified distance measure to compute the distances between the rows of a data matrix.
?t()
求矩陣的轉(zhuǎn)置

drows = dist(test, method = "minkowski")
dcols = dist(t(test), method = "minkowski")
pheatmap(test, clustering_distance_rows = drows, clustering_distance_cols = dcols)

minkowski度量我目前還不理解是什么。
我試了一下闪盔,和pheatmap(test)在圖片上看不出區(qū)別弯院。
11. 練習(xí)
#將原文本文件的第一列作為行名
a <- read.table("GSE17215_series_matrix.txt",comment.char = "!",sep = "\t",header = T)
rownames(a)=a[,1]
a=a[,-1]

# 或者如下
# a <- read.table("GSE17215_series_matrix.txt",comment.char = "!",sep = "\t",header = T,row.names = 1)
# View(a)
a <- log2(a)

隨機(jī)取40行畫熱圖,探針在各樣本中區(qū)別不明顯泪掀。

pheatmap::pheatmap(a[sample(1:nrow(a),40),])

取行標(biāo)準(zhǔn)差最大的40行畫熱圖听绳,差別出來了。

sd_top_40 <- names(sort(apply(a,1,sd),decreasing = T)[1:40])
sd_top_40
pheatmap(a[sd_top_40,])
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末异赫,一起剝皮案震驚了整個(gè)濱河市椅挣,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌塔拳,老刑警劉巖鼠证,帶你破解...
    沈念sama閱讀 206,723評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異靠抑,居然都是意外死亡量九,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門颂碧,熙熙樓的掌柜王于貴愁眉苦臉地迎上來荠列,“玉大人,你說我怎么就攤上這事载城〖∷疲” “怎么了?”我有些...
    開封第一講書人閱讀 152,998評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵诉瓦,是天一觀的道長(zhǎng)川队。 經(jīng)常有香客問我,道長(zhǎng)睬澡,這世上最難降的妖魔是什么固额? 我笑而不...
    開封第一講書人閱讀 55,323評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮猴贰,結(jié)果婚禮上对雪,老公的妹妹穿的比我還像新娘。我一直安慰自己米绕,他們只是感情好瑟捣,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評(píng)論 5 374
  • 文/花漫 我一把揭開白布馋艺。 她就那樣靜靜地躺著,像睡著了一般迈套。 火紅的嫁衣襯著肌膚如雪捐祠。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,079評(píng)論 1 285
  • 那天桑李,我揣著相機(jī)與錄音踱蛀,去河邊找鬼。 笑死贵白,一個(gè)胖子當(dāng)著我的面吹牛率拒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播禁荒,決...
    沈念sama閱讀 38,389評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼猬膨,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了呛伴?” 一聲冷哼從身側(cè)響起勃痴,我...
    開封第一講書人閱讀 37,019評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎热康,沒想到半個(gè)月后沛申,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,519評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡姐军,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評(píng)論 2 325
  • 正文 我和宋清朗相戀三年铁材,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片庶弃。...
    茶點(diǎn)故事閱讀 38,100評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡衫贬,死狀恐怖德澈,靈堂內(nèi)的尸體忽然破棺而出歇攻,到底是詐尸還是另有隱情,我是刑警寧澤梆造,帶...
    沈念sama閱讀 33,738評(píng)論 4 324
  • 正文 年R本政府宣布缴守,位于F島的核電站,受9級(jí)特大地震影響镇辉,放射性物質(zhì)發(fā)生泄漏屡穗。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評(píng)論 3 307
  • 文/蒙蒙 一忽肛、第九天 我趴在偏房一處隱蔽的房頂上張望村砂。 院中可真熱鬧,春花似錦屹逛、人聲如沸础废。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽评腺。三九已至帘瞭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蒿讥,已是汗流浹背蝶念。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評(píng)論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留芋绸,地道東北人媒殉。 一個(gè)月前我還...
    沈念sama閱讀 45,547評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像摔敛,于是被迫代替她去往敵國和親适袜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容