【轉(zhuǎn)載】【R高級教程】專題二:差異表達(dá)基因的分析

應(yīng)學(xué)生及個別博友的要求,盡管專業(yè)博文點(diǎn)擊率和反應(yīng)均很差,但在去San Diego參加PAG會議之前罗心,還是抽時(shí)間給出【R高級教程】的第二專題里伯。專題一給出了聚類分析的示例,本專題主要談在表達(dá)譜芯片分析中如何利用Bioconductor鑒定差異表達(dá)基因渤闷。

鑒定差異表達(dá)基因是表達(dá)譜芯片分析pipeline中必須的分析步驟疾瓮。差異表達(dá)基因分析是根據(jù)表型協(xié)變量(分類變量)鑒定組間差異表達(dá),它屬于監(jiān)督性分類的一種肤晓。在鑒定差異表達(dá)基因以前爷贫,一般需要對表達(dá)值實(shí)施非特異性過濾(在機(jī)器學(xué)習(xí)框架下屬于非監(jiān)督性分類)认然,因?yàn)檫m當(dāng)?shù)姆翘禺愋赃^濾可以提高差異表達(dá)基因的檢出率补憾、甚至是功效。R分析差異表達(dá)基因的library有很多卷员,但目前運(yùn)用最廣泛的Bioconductor包是limma盈匾。

本專題示例依然來自GEO數(shù)據(jù)庫中檢索號為GSE11787 的Affymetrix芯片的數(shù)據(jù),數(shù)據(jù)介紹參閱專題一毕骡。

>library(limma)

>design <- model.matrix(~ -1+factor(c(1,1,1, 2,2,2)))

這個是根據(jù)芯片試驗(yàn)設(shè)計(jì)削饵,對表型協(xié)變量的水平進(jìn)行design,比如本例中共有6張芯片未巫,前3張為control對照組窿撬,后3張芯片為實(shí)驗(yàn)處理組,用1表示對照組叙凡,用2表示處理組劈伴。其他試驗(yàn)設(shè)計(jì)同理,比如2*2的因子設(shè)計(jì)試驗(yàn)握爷,如果每個水平技術(shù)重復(fù)3次跛璧,那么可以表示為:design <- model.matrix(~ -1+factor(c(1,1,1, 2,2,2, 3,3,3, 4,4,4)))。接上面的程序語句繼續(xù):

>colnames(design) <- c("control", "LPS")

>fit <- lmFit(eset2, design)

>contrast.matrix <- makeContrasts(control-LPS, levels=design)

>fit <- eBayes(fit)

>fit2 <- contrasts.fit(fit, contrast.matrix)

>fit2 <- eBayes(fit2)

>results<-decideTests(fit2, method="global", adjust.method="BH", p.value=0.01, lfc=1.5)

>summary(results)

>vennCounts(results)

>vennDiagram(results)

比較遺憾的是新啼,目前l(fā)imma自帶的venn作圖函數(shù)不能做超過3維的高維venn圖追城,只能畫出3個圓圈的venn圖,即只能同時(shí)對三個coef進(jìn)行venn作圖燥撞。上面的venn圖只有一個coef座柱,太簡單了。下面是一個由本實(shí)驗(yàn)室芯片數(shù)據(jù)得出的三個coef的venn圖例:

>heatDiagram(results,fit2$coef)

紅色為control中(與LPS相比)的高表達(dá)基因物舒,綠色為control中(與LPS相比)的低表達(dá)基因色洞,x軸的數(shù)字表示差異表達(dá)基因在eset2中所處的位置。

>x<-topTable(fit2, coef=1, number=10000, adjust.method="BH", sort.by="B", resort.by="M")

>write.table(x, file="limma.xls", row.names=F, sep="\t")

將結(jié)果寫入limma.xls文件中茶鉴,內(nèi)容包括AveExpr值(比較組間絕對值的平均差異值)锋玲、logFC值(差異倍數(shù))、t值涵叮、P值惭蹂、q值(即adj.P.Val值)和B值伞插。一般logFC值、P值盾碗、q值和AveExpr值用來作為差異表達(dá)的判斷標(biāo)準(zhǔn)媚污,比如差異倍數(shù)在2倍以上、絕對差異表達(dá)在10以上廷雅、P值小于0.01等耗美。在Excel文件中,根據(jù)各項(xiàng)判斷標(biāo)準(zhǔn)排序航缀,可以很容易地得到差異表達(dá)基因列表商架,這個列表可以用來進(jìn)行后續(xù)的分析,如GO注釋芥玉、基因網(wǎng)絡(luò)繪制等蛇摸。

專題一中提到實(shí)際研究中,一般只用差異表達(dá)基因進(jìn)行聚類分析灿巧,在R中赶袄,根據(jù)差異表達(dá)結(jié)果過濾表達(dá)值很簡單(具體的值可以依據(jù)芯片數(shù)據(jù)的實(shí)際情況設(shè)定,比如P值可以設(shè)寬松點(diǎn)0.05抠藕、logFC的絕對值也可設(shè)為1或2饿肺、絕對表達(dá)差異也可設(shè)低一點(diǎn),如6或8這樣的值):

>y <- x[x$P.Value < 0.01 & (x$logFC > 1.5 | x$logFC < -1.5& x$AveExpr > 10),]

>length(y$ID)

>eset3<-eset2[y$ID,]

經(jīng)過上面P值盾似、表達(dá)倍數(shù)差異和絕對差異的過濾敬辣,eset3中就只包含差異表達(dá)基因了,這樣eset3可用來進(jìn)行聚類分析了颜说。

【除Bioconductor的logo购岗,所有圖片均由程序運(yùn)行所得】

本文引用地址:http://blog.sciencenet.cn/blog-295006-403640.html此文來自科學(xué)網(wǎng)朱猛進(jìn)博客,轉(zhuǎn)載請注明出處门粪。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末喊积,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子玄妈,更是在濱河造成了極大的恐慌乾吻,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拟蜻,死亡現(xiàn)場離奇詭異绎签,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)酝锅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進(jìn)店門诡必,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事爸舒◇郑” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵扭勉,是天一觀的道長鹊奖。 經(jīng)常有香客問我,道長涂炎,這世上最難降的妖魔是什么忠聚? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮唱捣,結(jié)果婚禮上两蟀,老公的妹妹穿的比我還像新娘。我一直安慰自己爷光,他們只是感情好垫竞,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布澎粟。 她就那樣靜靜地躺著蛀序,像睡著了一般。 火紅的嫁衣襯著肌膚如雪活烙。 梳的紋絲不亂的頭發(fā)上徐裸,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天,我揣著相機(jī)與錄音啸盏,去河邊找鬼重贺。 笑死,一個胖子當(dāng)著我的面吹牛回懦,可吹牛的內(nèi)容都是我干的气笙。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼怯晕,長吁一口氣:“原來是場噩夢啊……” “哼潜圃!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起舟茶,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤谭期,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后吧凉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體隧出,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年阀捅,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了胀瞪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡饲鄙,死狀恐怖凄诞,靈堂內(nèi)的尸體忽然破棺而出涵紊,到底是詐尸還是另有隱情,我是刑警寧澤幔摸,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布摸柄,位于F島的核電站,受9級特大地震影響既忆,放射性物質(zhì)發(fā)生泄漏驱负。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望谴麦。 院中可真熱鬧涡扼,春花似錦、人聲如沸酪术。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽绘雁。三九已至,卻和暖如春援所,著一層夾襖步出監(jiān)牢的瞬間庐舟,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工住拭, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留挪略,地道東北人。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓滔岳,卻偏偏與公主長得像杠娱,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子谱煤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容