R繪圖:ggplot2繪制火山圖

火山圖是測(cè)序分析報(bào)告中最為核心的圖片之一踊谋。繪制火山圖的方法有許多蝉仇,Excel和第三方軟件等,本文主要運(yùn)用ggplot2和ggrepel兩個(gè)R包演示[1][2]殖蚕。
橫坐標(biāo)為Fold change(倍數(shù))轿衔,越偏離中心差異倍數(shù)越大;縱坐標(biāo)為P value(P值)睦疫,值越大差異越顯著害驹。

(一):繪圖分析:

基本要素: 區(qū)分上調(diào)、下調(diào)的散點(diǎn)蛤育、輔助線宛官、坐標(biāo)軸圖例瓦糕、標(biāo)簽
運(yùn)用參數(shù): geom_point()底洗、geom_vline and geom_hline、labs()咕娄、theme()亥揖、geom_text_repel()

注:區(qū)分上、下調(diào)基因圣勒,就要對(duì)差異基因進(jìn)行統(tǒng)計(jì)學(xué)分析费变,主要包括統(tǒng)計(jì)顯著性和生物學(xué)差異顯著性;需要用到ifelse函數(shù) [3]

(二):數(shù)據(jù)處理

rm(list = ls())
library(ggplot2)
# 數(shù)據(jù)來自http://www.reibang.com/p/a973c29c9103 [參考資料2]
dataset <- read.table(file = "C:/Users/Administrator/Documents/dataset_volcano.txt", 
                      header = TRUE, sep = "")
# 設(shè)置p_value和logFC的閾值
cut_off_pvalue = 0.0000001  #統(tǒng)計(jì)顯著性
cut_off_logFC = 1           #差異倍數(shù)值

# 根據(jù)閾值參數(shù)圣贸,上調(diào)基因設(shè)置為‘up’挚歧,下調(diào)基因設(shè)置為‘Down’,無差異設(shè)置為‘Stable’旁趟,并保存到change列中
dataset$change = ifelse(dataset$P.Value < cut_off_pvalue & abs(dataset$logFC) >= cut_off_logFC, 
                          ifelse(dataset$logFC> cut_off_logFC ,'Up','Down'),
                          'Stable')
head(dataset)
          gene     logFC  P.Value change
1 LOC100909539 -4.514013 4.33e-12   Down
2       Steap2 -3.678175 1.12e-11   Down
3        Trpt1  2.594115 1.21e-11     Up
4        Cers6 -3.630773 1.45e-11   Down
5       Hs3st1 -3.129658 1.74e-11   Down
6        Lama5 -2.772380 2.51e-11   Down

先從整體判斷條件的真假:
  1. 不滿足昼激,記作"stable"庇绽;
  2. 滿足锡搜;
     logFC大于1,記作"up"瞧掺;
     logFC小于1耕餐,記作"down";

(三):繪圖

p <- ggplot(
  # 數(shù)據(jù)辟狈、映射肠缔、顏色
  dataset, aes(x = logFC, y = -log10(P.Value), colour=change)) +
  geom_point(alpha=0.4, size=3.5) +
  scale_color_manual(values=c("#546de5", "#d2dae2","#ff4757"))+
  # 輔助線
  geom_vline(xintercept=c(-1,1),lty=4,col="black",lwd=0.8) +
  geom_hline(yintercept = -log10(cut_off_pvalue),lty=4,col="black",lwd=0.8) +
  # 坐標(biāo)軸
  labs(x="log2(fold change)",
       y="-log10 (p-value)")+
  theme_bw()+
  # 圖例
  theme(plot.title = element_text(hjust = 0.5), 
        legend.position="right", 
        legend.title = element_blank())
p
  • Rplot01.png

(四):添加標(biāo)簽

# 將需要標(biāo)記的基因放置在label列(logFC >= 5)
library(ggrepel)
dataset$label <- ifelse(dataset$P.Value > cut_off_pvalue & abs(dataset$logFC) >= 5,
                      as.character(dataset$gene), "")
dataset[2600:2606, ]
     gene      logFC  P.Value change label
2600   Ano5  0.1883082 1.20e-07 Stable      
2601  Rab3a  0.8501624 1.21e-07 Stable      
2602  Pank1  5.2116194 1.21e-07 Stable Pank1
2603  Ghitm  2.4541362 1.21e-07 Stable      
2604 Ndufa8  1.4141038 1.21e-07 Stable      
2605 Zc3h7a -0.9070267 1.21e-07 Stable      
2606  Trpm3  0.1879326 1.21e-07 Stable

p + geom_label_repel(data = dataset, aes(x = dataset$logFC, 
                                     y = -log10(dataset$P.Value), 
                                     label = label),
                 size = 3, box.padding = unit(0.5, "lines"),
                 point.padding = unit(0.8, "lines"), 
                 segment.color = "black", 
                 show.legend = FALSE)

關(guān)于ggrepel包夏跷,后期會(huì)寫參數(shù)使用相關(guān)教程

  • Rplot02.png

(五):Volcano plot[4]

# 火山圖應(yīng)用
genes <- read.table(file = "C:/Users/Administrator/Documents/volcano.txt", header = TRUE)
genes$Significant <- ifelse(genes$padj < 0.05 & abs(genes$log2FoldChange) >= 1, 
                            ifelse(genes$log2FoldChange > 1, "Up", "Down"), "Stable")
ggplot(
  # 數(shù)據(jù)、映射明未、顏色
  genes, aes(x = log2FoldChange, y = -log10(pvalue))) +
  geom_point(aes(color = Significant), size=2) +
  scale_color_manual(values = c("blue","grey", "red")) +
  # 注釋
  geom_text_repel(
    data = subset(genes, padj < 0.05 & abs(genes$log2FoldChange) >= 1),
    aes(label = Gene),
    size = 5,
    box.padding = unit(0.35, "lines"),
    point.padding = unit(0.3, "lines")) +
  # 輔助線
  geom_vline(xintercept=c(-1,1),lty=4,col="black",lwd=0.8) +
  geom_hline(yintercept = 1,lty=4,col="black",lwd=0.8) +
  # 坐標(biāo)軸
  labs(x="log2(fold change)",
       y="-log10 (p-value)") +
  # 圖例
  theme(legend.position = "bottom")
Rplot01.png

進(jìn)一步修飾

# 進(jìn)一步修飾
ggplot(
  # 數(shù)據(jù)槽华、映射、顏色
  genes, aes(x = log2FoldChange, y = -log10(pvalue))) +
  geom_point(aes(color = Significant), size=2) +
  scale_color_manual(values = c("blue","grey", "red")) +
  # 注釋
  geom_label_repel(
    data = subset(genes, padj < 0.05 & abs(genes$log2FoldChange) >= 1),
    aes(label = Gene),
    size = 5,fill = "darkred", color = "white",
    box.padding = unit(0.35, "lines"),
    point.padding = unit(0.3, "lines")) +
  # 輔助線
  geom_vline(xintercept=c(-0.5, 0.5),lty=4,col="#666666",lwd=0.8) +
  geom_hline(yintercept = 1,lty=4,col="#666666",lwd=0.8) +
  # 坐標(biāo)軸
  labs(x="log2(fold change)",
       y="-log10 (p-value)") +
  # 圖例
  theme(legend.position = "bottom")
Rplot02.png

參考資料:


  1. 使用ggplot2和ggrepel包做火山圖 ?

  2. R 數(shù)據(jù)可視化 02 | 火山圖 ?

  3. R語言_ifelse()函數(shù)用法 ?

  4. ggplot2 texts : Add text annotations to a graph in R software ?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末趟妥,一起剝皮案震驚了整個(gè)濱河市猫态,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌披摄,老刑警劉巖亲雪,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異疚膊,居然都是意外死亡义辕,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門寓盗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來灌砖,“玉大人,你說我怎么就攤上這事贞让≈苷福” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵喳张,是天一觀的道長(zhǎng)续镇。 經(jīng)常有香客問我,道長(zhǎng)销部,這世上最難降的妖魔是什么摸航? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮舅桩,結(jié)果婚禮上酱虎,老公的妹妹穿的比我還像新娘。我一直安慰自己擂涛,他們只是感情好读串,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著撒妈,像睡著了一般恢暖。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上狰右,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天杰捂,我揣著相機(jī)與錄音,去河邊找鬼棋蚌。 笑死嫁佳,一個(gè)胖子當(dāng)著我的面吹牛挨队,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蒿往,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼盛垦,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了瓤漏?” 一聲冷哼從身側(cè)響起情臭,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎赌蔑,沒想到半個(gè)月后俯在,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡娃惯,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年跷乐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片趾浅。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡愕提,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出皿哨,到底是詐尸還是另有隱情浅侨,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布证膨,位于F島的核電站如输,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏央勒。R本人自食惡果不足惜不见,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望崔步。 院中可真熱鬧稳吮,春花似錦、人聲如沸井濒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽瑞你。三九已至酪惭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間捏悬,已是汗流浹背撞蚕。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工润梯, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留过牙,地道東北人甥厦。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像寇钉,于是被迫代替她去往敵國和親刀疙。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 火山圖(Volcano Plot)常用于展示基因表達(dá)差異的分布扫倡,橫坐標(biāo)常為Fold change(倍數(shù))谦秧,越偏離中...
    生信補(bǔ)給站閱讀 4,812評(píng)論 0 26
  • 這段時(shí)間給兒子報(bào)了一個(gè)英語短期的輔導(dǎo)班,接他時(shí)英語老師跟我說兒子的課堂氣氛非常好撵溃,兒子不忘插上幾句說課堂上...
    四年級(jí)三班竇奕銘媽媽閱讀 179評(píng)論 0 0
  • 今天我生日疚鲤,女兒提前給我買了我最愛的巧克力作為生日禮物,還要她媽媽保密缘挑,卻被她媽媽提前劇透了集歇,劇透得讓我感覺比品巧...
    AdamDai閱讀 544評(píng)論 30 21
  • 在寫自我介紹的時(shí)候,kiss覺得真煩人语淘,每天重復(fù)同樣的內(nèi)容诲宇,說同樣的話,于是惶翻,在寫完堅(jiān)韌姑蓝、抗壓、擅長(zhǎng)文字幾個(gè)字以外...
    日影西窗閱讀 305評(píng)論 2 4
  • 主播河森堡吕粗,本名袁碩纺荧,英文名Hesenberg,1988年10月20日出生于北京颅筋,天秤座虐秋。國家博物館講解員,新生代...
    雪貓貓999閱讀 1,293評(píng)論 0 3