day49 轉(zhuǎn)錄組 差異基因表達(dá)分析

學(xué)習(xí)資料:B站視頻:生物技能樹 第八季轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析
得到表達(dá)矩陣之后就要考慮如何知道到差異表達(dá)基因(DEG)等脂,這個(gè)要在R中操作栽烂,具體是需要airway、DESeq2昙衅、edgeR這三個(gè)包度帮。
airway這個(gè)包是數(shù)據(jù)包歼捏,但我覺得沒啥用,它那些個(gè)命令只能用于它自己的數(shù)據(jù)笨篷,用自己從GEO上搞來的數(shù)據(jù)不香么瞳秽?雞肋。
DESeq2和EdgeR都是做基因差異表達(dá)分析的率翅,主要用于RNA-Seq數(shù)據(jù)寂诱,有些研究者用來處理類似的ChIP-Seq, shRNA、質(zhì)譜數(shù)據(jù)等安聘,原理都是在不同處理因素的組別之間找差異。

一瓢棒、安裝R包

1浴韭,執(zhí)行下面命令:

install.packages("BiocManager") #先安裝biocmanager
library(BiocManager)
BiocManager::install ('airway')#這個(gè)包安裝很費(fèi)勁,報(bào)錯(cuò)脯宿,但實(shí)際上也沒用念颈。后悔安裝之。
BiocManager::install ('DESeq2')
BiocManager::install ('edgeR')
Update all/some/none? [a/s/n]: 回答a连霉。

2榴芳,安裝airwa的時(shí)候出現(xiàn)報(bào)錯(cuò):


image.png

解決辦法一——失敗:
remove.packages("cluster", lib="C:/Program Files/R/R-4.1.3/library")
remove.packages("MASS", lib="C:/Program Files/R/R-4.1.3/library")
remove.packages("Matrix", lib="C:/Program Files/R/R-4.1.3/library")
remove.packages("mgcv", lib="C:/Program Files/R/R-4.1.3/library")
remove.packages("nlme",lib="C:/Program Files/R/R-4.1.3/library")
remove.packages("survival", lib="C:/Program Files/R/R-4.1.3/library")
重新BiocManager::install ('airway')跺撼,依然報(bào)錯(cuò)窟感。

解決辦法二——成功:
下載該軟件到本地,再從右下角的install按鈕安裝歉井,如圖:


image.png

3柿祈,卸載R包
由于后來發(fā)現(xiàn)airway沒用,就練習(xí)了一下卸載。
remove.packages('airway')

二躏嚎、文件準(zhǔn)備

1蜜自,表達(dá)矩陣
通過前面計(jì)數(shù)后得到的txt文件,在excel里修整成為如下表卢佣,保留列名為樣本名重荠,行名為geneid。


image.png

2虚茶,分組準(zhǔn)備
建立txt文件


image.png

三戈鲁、讀入并對(duì)表達(dá)矩陣進(jìn)行過濾

rm(list = ls()) #首先清空R中的變量
setwd("D:/work/NGSanalysis/rnaseq")
a=read.table('D:/work/NGSanalysis/rnaseq/counts2.txt', header=T, row.names=1, stringsAsFactors = F) #行名,列名都設(shè)定了
index1=c(rowSums(a)>0) #刪除都是零的基因刪除
exprSet=a[index1,] #建立一個(gè)表達(dá)矩陣
write.csv(exprSet,'filter_reads_matrix.csv' )#過濾后的數(shù)據(jù)

四媳危、差異分析:接上面步驟

library(DESeq2)
group=read.table('D:/work/NGSanalysis/rnaseq/group.txt', row.names=1,stringsAsFactors =T )#讀入分組文件荞彼,為因子,有行名(樣本名)
group_list=group[,1]  #取這一列的數(shù)據(jù)為變量group_list
coldata <- data.frame(row.names =colnames(exprSet), group_list) #創(chuàng)建一個(gè)數(shù)據(jù)框coldata待笑,只有一列內(nèi)容是分組信息鸣皂,行名為樣本名,
dds <- DESeqDataSetFromMatrix(countData = exprSet, colData = coldata, design = ~group_list)  #這個(gè)命令創(chuàng)建DEseqDataSet(dds)暮蹂。countData用于說明數(shù)據(jù)來源寞缝,colData用于說明不同組數(shù)據(jù)的實(shí)驗(yàn)操作類型,design用于聲明自變量仰泻,即誰和誰進(jìn)行對(duì)比

dds2 <- DESeq(dds)  #用于對(duì)dds數(shù)據(jù)進(jìn)行運(yùn)算及分析,共三步:文庫大小估計(jì)荆陆;離散程度估計(jì);統(tǒng)計(jì)檢驗(yàn)

res <- results(dds2,contrast = c("group_list","siSUZ12","con")) #生成結(jié)果文件,siSUZ12組vs. con組集侯。

resOrdered<- res[order(res$padj),]  #order函數(shù)是給出從小到大排序后的位置(默認(rèn)升序), 將結(jié)果文件按照res文件中的padj這一列進(jìn)行降序排列被啼,其中$符號(hào)表示res中的padj這一列
DEG=as.data.frame(resOrdered)
write.csv(DEG,file = "treat_vs_con.csv") #在工作目錄中生成結(jié)果文件
  #按照自定義閾值提取差異基因
DEGsig <-subset(res, padj < 0.001 & abs(log2FoldChange) > 1)
write.csv(DEGsig,file= "treat_vs_con_sig.csv")
image.png

五、用DESeq2歸一化的表達(dá)矩陣

rld <- rlogTransformation(dds2)  ## 得到經(jīng)過normlization的表達(dá)矩陣棠枉。
exprSet_new=assay(rld)  #生成矩陣文件
write.csv(exprSet_new,'Normalized_matrix.csv' ) #導(dǎo)出數(shù)據(jù)浓体,保存為csv格式。

說明
rlogTransformation是DESeq2包中的一個(gè)命令(函數(shù))辈讶,在help文檔中查看命浴,它能把原始含有reads的表達(dá)數(shù)值,根據(jù)整個(gè)樣本和每個(gè)基因的長(zhǎng)度等贱除,計(jì)算出相對(duì)表達(dá)生闲。并表示為log2格式,因此最后導(dǎo)出的數(shù)據(jù)里會(huì)有負(fù)數(shù)月幌。比如-1.7碍讯,就是2^(-1.7)=0.3。
assay是SummarizedExperiment包中的函數(shù)扯躺,可以把陣提取出來冲茸。

六屯阀、雙因素差異分析

參考教程:http://www.reibang.com/p/eeefead7adde

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市轴术,隨后出現(xiàn)的幾起案子难衰,更是在濱河造成了極大的恐慌,老刑警劉巖逗栽,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件盖袭,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡彼宠,警方通過查閱死者的電腦和手機(jī)鳄虱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凭峡,“玉大人拙已,你說我怎么就攤上這事〈菁剑” “怎么了倍踪?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)索昂。 經(jīng)常有香客問我建车,道長(zhǎng),這世上最難降的妖魔是什么椒惨? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任缤至,我火速辦了婚禮,結(jié)果婚禮上康谆,老公的妹妹穿的比我還像新娘领斥。我一直安慰自己,他們只是感情好沃暗,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布戒突。 她就那樣靜靜地躺著,像睡著了一般描睦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上导而,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天忱叭,我揣著相機(jī)與錄音,去河邊找鬼今艺。 笑死韵丑,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的虚缎。 我是一名探鬼主播撵彻,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼钓株,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了陌僵?” 一聲冷哼從身側(cè)響起轴合,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎碗短,沒想到半個(gè)月后受葛,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡偎谁,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年总滩,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片巡雨。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡闰渔,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出铐望,到底是詐尸還是另有隱情冈涧,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布蝌以,位于F島的核電站炕舵,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏跟畅。R本人自食惡果不足惜咽筋,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望徊件。 院中可真熱鬧奸攻,春花似錦、人聲如沸虱痕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽部翘。三九已至硝训,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間新思,已是汗流浹背窖梁。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留夹囚,地道東北人纵刘。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像荸哟,于是被迫代替她去往敵國(guó)和親假哎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子瞬捕,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容