【RNA-seq自學(xué)09】數(shù)據(jù)分析之差異基因分析DEseq2、可視化

1扑庞、在R中安裝DESeq2軟件包

官方網(wǎng)站

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("DESeq2")

2譬重、運(yùn)行

準(zhǔn)備工作

# read.table ,文件有header,第一行為row.name;
input_data <- read.table("deseq2_input.txt", header=TRUE, row.names=1)

# 取整,函數(shù)round
input_data <-round(input_data,digits = 0)

# 準(zhǔn)備文件
# as.matrix 將輸入文件轉(zhuǎn)換為表達(dá)矩陣;
input_data <- as.matrix(input_data)

# 控制條件:因子(對(duì)照2罐氨,實(shí)驗(yàn)2)
condition <- factor(c(rep("ct1", 2), rep("exp", 2)))

# input_data根據(jù)控制條件構(gòu)建data.frame
coldata <- data.frame(row.names=colnames(input_data), condition)

library(DESeq2)
# build deseq input matrix 構(gòu)建輸入矩陣
#countData作為矩陣的input_data臀规;colData Data.frame格式;控制條件design;
dds <- DESeqDataSetFromMatrix(countData=input_data,colData=coldata, design=~condition)

DESeq2 進(jìn)行差異分析

#構(gòu)建dds對(duì)象
dds <- DESeq(dds)
# 提取結(jié)果
#dds dataset格式轉(zhuǎn)換為DESeq2 中result數(shù)據(jù)格式栅隐,矯正值默認(rèn)0.1
res <- results(dds,alpha=0.05)
#查看res(DESeqresults格式),可以看到上下調(diào)基因
summary(res)

# 將進(jìn)過矯正后的表達(dá)量結(jié)果加進(jìn)去塔嬉;
resdata <- merge(as.data.frame(res), as.data.frame(counts(dds, normalized=TRUE)),by="row.names",sort=FALSE)
names(resdata)[1] <- "Gene"
#查看(resdata)
# output result 輸出結(jié)果
write.table(resdata,file="diffexpr-results.txt",sep = "\t",quote = F, row.names = F)
diffexpr-results.txt

可視化展示

plotMA(res)
maplot <- function (res, thresh=0.05, labelsig=TRUE,...){
with(res,plot(baseMean, log2FoldChange, pch=20, cex=.5, log="x", ...))
with(subset(res, padj<thresh), points(baseMean, log2FoldChange, col="red", pch=20,cex=1.5))
}
png("diffexpr-malot.png",1500,1000,pointsize=20)
maplot(resdata, main="MA Plot")
dev.off()

畫火山圖

install.packages("ggrepel")
library(ggplot2)
library(ggrepel)

resdata$significant <- as.factor(resdata$padj<0.05 & abs(resdata$log2FoldChange) > 1)
ggplot(data=resdata, aes(x=log2FoldChange, y =-log10(padj),color =significant)) +
geom_point() +
ylim(0, 8)+
scale_color_manual(values =c("black","red"))+
geom_hline(yintercept = log10(0.05),lty=4,lwd=0.6,alpha=0.8)+
geom_vline(xintercept = c(1,-1),lty=4,lwd=0.6,alpha=0.8)+
theme_bw()+
theme(panel.border = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank(),
axis.line = element_line(colour = "black"))+
labs(title="Volcanoplot_biotrainee (by sunyi)", x="log2 (fold change)",y="-log10 (padj)")+

theme(plot.title = element_text(hjust = 0.5))+
geom_text_repel(data=subset(resdata, -log10(padj) > 6), aes(label=Gene),col="black",alpha =0.8)
火山圖

差異基因的提取

#查看符合條件的差異基因
awk '{if($3>1 && $7<0.05)print $0}' diffexpr-results.txt |head
#查看差異基因有多少行
awk '{if($3>1 && $7<0.05)print $0}' diffexpr-results.txt |wc -l
#提取某幾列
awk '{if($3>1 && $7<0.05)print $0}' diffexpr-results.txt |cut -f 1,2,4,7 |head
#上調(diào)基因的提取;
awk '{if($3>1 && $7<0.05)print $0}' diffexpr-results.txt |cut -f 1,2,4,7 > up.gene.txt
#下調(diào)基因的提取;
awk '{if($3<-1 && $7<0.05)print $0}' diffexpr-results.txt |cut -f 1,2,4,7 > down.gene.txt

根據(jù)第1列是Geneid,第7,8租悄,9谨究,10列是counts數(shù),用awk提取出geneID和counts恰矩。

awk -F '\t' '{print $1,$7,$8,$9,$10}' OFS='\t' out_counts.txt >subread_matrix.out

參考:
生物信息樹

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末记盒,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子外傅,更是在濱河造成了極大的恐慌纪吮,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件萎胰,死亡現(xiàn)場(chǎng)離奇詭異碾盟,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)技竟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門冰肴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事熙尉×撸” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵检痰,是天一觀的道長(zhǎng)包归。 經(jīng)常有香客問我,道長(zhǎng)铅歼,這世上最難降的妖魔是什么公壤? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮椎椰,結(jié)果婚禮上厦幅,老公的妹妹穿的比我還像新娘。我一直安慰自己慨飘,他們只是感情好确憨,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著套媚,像睡著了一般缚态。 火紅的嫁衣襯著肌膚如雪磁椒。 梳的紋絲不亂的頭發(fā)上堤瘤,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音浆熔,去河邊找鬼本辐。 笑死,一個(gè)胖子當(dāng)著我的面吹牛医增,可吹牛的內(nèi)容都是我干的慎皱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼叶骨,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼茫多!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起忽刽,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤天揖,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后跪帝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體今膊,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年伞剑,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了斑唬。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖恕刘,靈堂內(nèi)的尸體忽然破棺而出缤谎,到底是詐尸還是另有隱情,我是刑警寧澤褐着,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布弓千,位于F島的核電站,受9級(jí)特大地震影響献起,放射性物質(zhì)發(fā)生泄漏洋访。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一谴餐、第九天 我趴在偏房一處隱蔽的房頂上張望姻政。 院中可真熱鬧,春花似錦岂嗓、人聲如沸汁展。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽食绿。三九已至,卻和暖如春公罕,著一層夾襖步出監(jiān)牢的瞬間器紧,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工楼眷, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留铲汪,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓罐柳,卻偏偏與公主長(zhǎng)得像掌腰,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子张吉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353