好久不見(jiàn)砸泛!
今天我們重復(fù)和學(xué)習(xí)這篇cell文章的Figure 3D耕腾。仔細(xì)看圖榕暇,這個(gè)散點(diǎn)圖表示的是兩種細(xì)胞中上調(diào)的基因蓬衡,很明顯散點(diǎn)作圖用的是基因Log2FC做的。再仔細(xì)看看彤枢,這個(gè)圖的另一個(gè)意思其實(shí)就是韋恩圖狰晚,A中上調(diào)的基因用一個(gè)顏色表示,B用一個(gè)顏色表示缴啡,共有的用另外一種顏色壁晒。很有趣的一張圖。
首先我們也準(zhǔn)備兩組細(xì)胞的差異基因變化倍數(shù)數(shù)據(jù)业栅,數(shù)據(jù)純屬虛構(gòu)秒咐!
setwd("E:/生物信息學(xué)/韋恩圖+散點(diǎn)圖")
df <- read.csv("A.csv",header = T)
這個(gè)散點(diǎn)圖有意思的地方在于不同的點(diǎn)用不同的顏色表示〉庠#看過(guò)火山圖(轉(zhuǎn)錄組不求人系列(十): NCS級(jí)別的火山圖携取,總有一款適合你!)的小伙伴應(yīng)該很快就能想到帮孔,有一個(gè)函數(shù)可以實(shí)現(xiàn)這個(gè)做法雷滋,那就是ggscatter。接下來(lái)加載包并定義不同的組文兢。
library(ggpubr)
library(ggthemes)
df$group = 'ns'#添加一組
df$group[which(df$A_log2FC>12)]='A'#A上調(diào)基因
df$group[which(df$B_log2FC>8)]='B'#B上調(diào)基因
df$group[which((df$B_log2FC>8)&(df$A_log2FC>12))]='AB'#AB共同上調(diào)基因
畫散點(diǎn)圖:
ggscatter(df,
x= 'A_log2FC',
y= 'B_log2FC',
color = 'group',
palette = c("#28A0A3", "#729730","#BD3342","#BBBBBB"),
size = 2)+ theme_base()
這里有個(gè)問(wèn)題需要說(shuō)明晤斩,那就是顏色排序,我們可以看右側(cè)group姆坚,默認(rèn)是按照首字母排序的尸昧,所以在palette這里顏色可以按照這個(gè)排序。
這個(gè)圖中很顯然旷偿,不同的點(diǎn)圈起來(lái)了烹俗。可以通過(guò)后期AI修飾手動(dòng)添加萍程。這里我們回顧下幢妄,PCA畫圖添加過(guò)置信橢圓(轉(zhuǎn)錄組不求人系列(三):PCA分析及CNS級(jí)別作圖),試試能不能用這個(gè)辦法添加茫负。ggscatter函數(shù)中有置信橢圓設(shè)置蕉鸳,所以是可以的。效果如下忍法。
ggscatter(df,
x= 'A_log2FC',
y= 'B_log2FC',
color = 'group',
palette = c("#28A0A3", "#729730","#BD3342","#BBBBBB"),
size = 2,
ellipse = T,
ellipse.level=0.8,
ellipse.alpha=0)+ theme_base()
這樣我們就實(shí)現(xiàn)了cell文章中的效果了潮尝。至于其他的添加文字等,需要用軟件編輯饿序!
今天這個(gè)內(nèi)容你學(xué)會(huì)了嗎勉失?還不快點(diǎn)贊+關(guān)注!T健乱凿!