導(dǎo)讀
火山圖表示兩組間的差異浩螺,而在scRNA-seq中靴患,同時會有多個cluster(vs其他cluster)的差異。如果用常規(guī)火山圖展示要出,可能需要繪制十幾個圖鸳君。有沒有更高效的展示方法呢?今天給大家?guī)鞢ELL文章“A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart”中展示scRNA-seq差異基因的多組火山圖的繪制方法患蹂。
?1或颊,常規(guī)火山圖
在RNA-seq(或蛋白質(zhì)組砸紊,或代謝組)數(shù)據(jù)分析中,火山圖是常見的一種數(shù)據(jù)可視化工具饭宾,它通過將統(tǒng)計顯著性量度(如p值)和變化幅度(例如log2FC)相結(jié)合批糟,幫助研究者快速直觀地識別出在不同樣本間具有顯著差異表達的基因(或蛋白,或代謝物)看铆。
火山圖本質(zhì)上是一種散點圖徽鼎,每個點代表一個基因(或蛋白,或代謝物)弹惦,其位置由兩個坐標軸定義:橫軸通常表示變化幅度(如log2 fold change否淤,log2FC),縱軸表示統(tǒng)計顯著性(如-log10 p-value)棠隐。倍數(shù)變化(fold change)是衡量基因(或蛋白石抡,或代謝物)在一組樣本中相對于另一組樣本的表達水平變化的指標。如果log2FC大于0助泽,則表示基因在實驗組中的表達量上升啰扛;如果log2FC小于0,則表示表達量下降嗡贺。
火山圖可以展示為不同顏色的點隐解,通常紅色表示上調(diào)基因,藍色表示下調(diào)基因诫睬,而灰色表示無顯著差異的基因煞茫。
2,scRNA-seq火山圖
2019年發(fā)表在CELL上的文章“A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart”fig 2h給我們展示了單細胞RNA測序數(shù)據(jù)展示的新思路摄凡。
圖中展示了10個cluster的差異基因续徽。其中X軸利用10個矩形塊(編號0-9)將整個區(qū)域分成10快:cluster0 - cluster9。每一塊中X軸上的點進行了抖動(jitter亲澡,隨機抖動)钦扭,Y軸表示logFC,并標注了每個cluster上topN的基因谷扣。紅色點表示adjusted
pval<0.01土全,黑色點表示adjusted pval>0.01。從圖中可以很容易地觀察到每個cluster(vs其他cluster)的差異基因会涎,倍數(shù)變化范圍裹匙,大概的差異基因數(shù),以及adjusted pval的情況末秃。令人耳目一新概页。
3,余丁解圖
所有的圖都是由點练慕、線惰匙、顏色等組成的技掏。這個圖由以下元素構(gòu)成:
1),表示基因的點项鬼,每個點的位置由X軸cluster的編號和Y軸logFC組成哑梳,并且在X軸的方向上進行了jitter;每個點根據(jù)adjusted
pval的大小以不同的顏色表示绘盟,可以使用geom_jitter繪制鸠真;
2),0-9的cluster龄毡,就是10個矩形吠卷,標注了不同cluster的編號,可以使用geom_tile函數(shù)繪制
3)沦零,限制不同cluster的灰色矩形背景祭隔,可以使用geom_col函數(shù)繪制。
由于jitter的點是隨機抖動的路操,所以如何標注jitter后基因的位置是本圖的難點疾渴,這也是網(wǎng)上其他教程懸而未決的問題。
4屯仗,在線繪制scRNA-seq多組火山圖
4.1 打開微生信在線作圖網(wǎng)站
https://bioinformatics.com.cn/plot_basic_scrna_multi_volcano_plot_244
4.2? 示例數(shù)據(jù)
點擊右側(cè)的示例數(shù)據(jù)程奠,下載打開。
示例數(shù)據(jù)包括四列祭钉,A列是基因,B列是log2FC己沛,C列是pvalue慌核,D列是cluster。
4.3 粘貼示例數(shù)據(jù)
拷貝ABCD 4列申尼,粘貼到第一個輸入框垮卓。若數(shù)據(jù)較多,也可以上傳tab分割的txt文件师幕。
4.4 設(shè)置參數(shù)
可選參數(shù)我們設(shè)置了
1)標注基因的輸入框
若留空則標注log2FC top10的差異基因粟按;若有數(shù)據(jù)(數(shù)據(jù)為上述表格中感興趣基因所在的行)。
2)圖片大小霹粥、字體灭将、cluster背景顏色及透明度
3)cluster矩形的顏色
共設(shè)置了12種可選顏色,第13+種使用系統(tǒng)默認的顏色
4)p/fdr閾值和log2fc閾值
其中p閾值也可以使用科學(xué)計數(shù)法表示后控。
Log2fc閾值用來控制cluster矩形的高度庙曙。因為我們一般不繪制非差異的點(基因)。
5)繪圖模式及顏色
提供了3種繪圖模式浩淘。
第一種是up捌朴,down模式吴攒。Up一種顏色,down一種顏色砂蔽。
第二種是p模式洼怔,p小于閾值的一種顏色,p大于閾值的一種顏色左驾。
第三種是組合模式镣隶,up一種顏色,down一種顏色什荣,p小于閾值的一種顏色矾缓。
同時提供了點大小、Y軸說明和字體等參數(shù)供選擇稻爬。
4.5 提交出圖
粘貼好數(shù)據(jù)嗜闻,選擇好參數(shù)后,點擊提交按鈕桅锄,等待約5s后會生成scRNA-seq多組火山圖琉雳。
從圖中C3最上方標注的點可以看出,微生信完美解決了網(wǎng)上其他教程中“線指虛空”的問題友瘤。
我們提供了PDF翠肘、SVG兩種矢量圖,PNG和tiff兩種標量圖供大家下載使用辫秧。其中矢量圖可以使用acrobat illustruator或者inkscape進行編輯束倍,例如拖動legend的位置等。
微生信助力高分文章盟戏,用戶183000绪妹,谷歌學(xué)術(shù)3400篇