拿到FPKM文件后該怎么轉(zhuǎn)錄組下游分析

  • 文獻(xiàn)標(biāo)題是:Oncogenic lncRNA downregulates cancer cell antigen presentation and intrinsic tumor suppression不過不需要看文章,大家只需要做差異分析即可,這個(gè)時(shí)候需要注意的是,作者提供的是RPKM值表達(dá)矩陣虏劲!
  • 6個(gè)樣本武契,分成2組幌陕,是RPKM值表達(dá)矩陣份氧,做差異分析,看GO通路荸实,跟文章比較
  • 作業(yè):(f) Enrichment of GO biological process (BP) terms for up-regulated genes (red) and down-regulated genes in tumor versus normal samples (n?=?3, 3 animals). (g-i) Log2 of fold changes of indicated metabolites in MMTV-Tg(LINK-A) breast tumor compared to that of Tg(LINK-A) mammary gland (n?=?3 animals respectively).
  • 首先需要去GEO數(shù)據(jù)庫下載文件GSE113143_Normal_Tumor_Expression.tab.gz
    1.下載數(shù)據(jù)GSE113143并加載數(shù)據(jù)
a=read.table('GSE113143_Normal_Tumor_Expression.tab.gz',sep='\t',quote = "",fill = T,
             comment.char = "!",header = T) # 提取表達(dá)矩陣
rownames(a)=a[,1]
a <- a[,-1]

TPM值就是RPKM的百分比:關(guān)于TPM的解釋可以看看這個(gè)
What the FPKM? A review of RNA-Seq expression units
Question: Differential expression analysis starting from TPM data
2.將FPKM轉(zhuǎn)換為TPM

expMatrix <- a
fpkmToTpm <- function(fpkm)
{
  exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
}
tpms <- apply(expMatrix,2,fpkmToTpm)
tpms[1:3,]
colSums(tpms)
#輸出結(jié)果:
> tpms[1:3,]
                  N1      N2    N3    T1    T2    T3
0610005C13Rik  0.232  0.1715  0.00  0.00  0.00  0.00
0610007P14Rik 48.391 39.2632 46.04 50.04 59.05 67.29
0610009B22Rik 47.491 58.5954 54.27 49.79 53.13 58.00
> colSums(tpms)
   N1    N2    N3    T1    T2    T3 
1e+06 1e+06 1e+06 1e+06 1e+06 1e+06 

3.差異分析

group_list=c(rep('Normal',3),rep('Tumor',3))
## 強(qiáng)制限定順序
group_list <- factor(group_list,levels = c("Normal","Tumor"),ordered = F)
#表達(dá)矩陣數(shù)據(jù)校正
exprSet <- tpms
boxplot(exprSet,outline=FALSE, notch=T,col=group_list, las=2)
library(limma) 
exprSet=normalizeBetweenArrays(exprSet)
boxplot(exprSet,outline=FALSE, notch=T,col=group_list, las=2)
#判斷數(shù)據(jù)是否需要轉(zhuǎn)換
exprSet <- log2(exprSet+1)
#差異分析:
dat <- exprSet
design=model.matrix(~factor( group_list ))
fit=lmFit(dat,design)
fit=eBayes(fit)
options(digits = 4)
topTable(fit,coef=2,adjust='BH')
bp=function(g){
  library(ggpubr)
  df=data.frame(gene=g,stage=group_list)
  p <- ggboxplot(df, x = "stage", y = "gene",
                 color = "stage", palette = "jco",
                 add = "jitter")
  #  Add p-value
  p + stat_compare_means()
}
deg=topTable(fit,coef=2,adjust='BH',number = Inf)
head(deg) 
#save(deg,file = 'deg.Rdata')

這里面重點(diǎn)就是:RPKM矩陣可以轉(zhuǎn)為TPM后,再使用limma進(jìn)行差異分析哦!

4.做完差異分析

  • GEO數(shù)據(jù)挖掘代碼,很容易得到上下調(diào)基因缴淋,而且轉(zhuǎn)為ENTREZID准给,后續(xù)分析都以這個(gè)為主線。
  • 根據(jù)原文文獻(xiàn)中:Differential gene expression was defined if the fold change &gt;1.5 and P?&lt;?0.05 between tumor and normal samples找差異基因
## 不同的閾值重抖,篩選到的差異基因數(shù)量就不一樣露氮,后面的超幾何分布檢驗(yàn)結(jié)果就大相徑庭。
if(T){
  logFC_t=1.5
  deg$g=ifelse(deg$P.Value>0.05,'stable',
               ifelse( deg$logFC > logFC_t,'UP',
                       ifelse( deg$logFC < -logFC_t,'DOWN','stable') )
  )
  table(deg$g)
  head(deg)
  deg$symbol=rownames(deg)
  library(ggplot2)
  library(clusterProfiler)
  library(org.Mm.eg.db)
  df <- bitr(unique(deg$symbol), fromType = "SYMBOL",
             toType = c( "ENTREZID"),
             OrgDb = org.Mm.eg.db)
  head(df)
  DEG=deg
  head(DEG)

  DEG=merge(DEG,df,by.y='SYMBOL',by.x='symbol')
  head(DEG)

  save(DEG,file = 'anno_DEG.Rdata')
  gene_up= DEG[DEG$g == 'UP','ENTREZID'] 
  gene_down=DEG[DEG$g == 'DOWN','ENTREZID'] 
}

5.最簡單的超幾何分布檢驗(yàn)

# 最簡單的超幾何分布檢驗(yàn)
###這里就拿KEGG數(shù)據(jù)庫舉例吧钟沛,拿自己判定好的上調(diào)基因集進(jìn)行超幾何分布檢驗(yàn)畔规,如下
if(T){
  gene_down
  gene_up
  enrichKK <- enrichKEGG(gene         =  gene_up,
                         organism     = 'mmu',
                         #universe     = gene_all,
                         pvalueCutoff = 0.05,
                         qvalueCutoff =0.05)
  head(enrichKK)[,1:6] 
  browseKEGG(enrichKK, 'hsa04512')
  dotplot(enrichKK)
  ggsave("enrichKK.png")
  enrichKK=DOSE::setReadable(enrichKK, OrgDb='org.Mm.eg.db',keyType='ENTREZID')
  enrichKK 
}
##最基礎(chǔ)的條形圖和點(diǎn)圖
#條帶圖
barplot(enrichKK,showCategory=20)
#氣泡圖
dotplot(enrichKK)
image.png

enrichKK.png

通路與基因之間的關(guān)系可視化

#通路與上調(diào)基因之間的關(guān)系可視化
###制作genlist三部曲:
## 1.獲取基因logFC
DEG_up <- DEG[DEG$g == 'UP',]
geneList <- DEG_up$logFC
## 2.命名
names(geneList) = DEG_up$ENTREZID
## 3.排序很重要
geneList = sort(geneList, decreasing = TRUE)
head(geneList)

cnetplot(enrichKK, categorySize="pvalue", foldChange=geneList,colorEdge = TRUE)
cnetplot(enrichKK, foldChange=geneList, circular = TRUE, colorEdge = TRUE)
ggsave("enrichKK_cnetplot.png")
image.png

enrichKK_cnetplot.png

通路與通路之間的連接展示

#通路與通路之間的連接展示
emapplot(enrichKK)
ggsave("enrichKK_emapplot.png")
image.png

enrichKK_emapplot.png

熱圖展現(xiàn)通路與基因之間的關(guān)系

#熱圖展現(xiàn)通路與基因之間的關(guān)系
heatplot(enrichKK)
ggsave("enrichKK_heatplot.png")

enrichKK_heatplot.png

如果你是做GO數(shù)據(jù)庫呢,其實(shí)還有一個(gè)goplot可以試試看恨统,當(dāng)然是以Y叔的書為主啦叁扫。

#如果你是做GO數(shù)據(jù)庫呢三妈,其實(shí)還有一個(gè)goplot可以試試看
ego_bp_up<-enrichGO(gene       = DEG_up$ENTREZID,
                 OrgDb      = org.Mm.eg.db,
                 keyType    = 'ENTREZID',
                 ont        = "BP",
                 pAdjustMethod = "BH",
                 pvalueCutoff = 0.01,#0.01
                 qvalueCutoff = 0.05)
goplot(ego_up)
ggsave("ego_bp_up_goplot.png")
head(ego)
library(stringr)
barplot(ego_bp_up,showCategory = 16,title="The GO_BP enrichment analysis of all DEGs ")+ 
  scale_size(range=c(2, 12))+
  scale_x_discrete(labels=function(ego_bp) str_wrap(ego_bp,width = 25))
ggsave("ego_bp_up_barplot.png")

image.png

image.png

ego_up_barplot.png

  • 同樣的方式看看下調(diào)基因的GO_BP:
image.png

down_regulated_genes.png


  • 和文獻(xiàn)中的GO_BP比較一下
image.png

GO_BP
RNAseq數(shù)據(jù),下載GEO中的FPKM文件后該怎么下游分析

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末莫绣,一起剝皮案震驚了整個(gè)濱河市畴蒲,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌对室,老刑警劉巖模燥,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異软驰,居然都是意外死亡涧窒,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進(jìn)店門锭亏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來纠吴,“玉大人,你說我怎么就攤上這事慧瘤〈饕眩” “怎么了?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵锅减,是天一觀的道長糖儡。 經(jīng)常有香客問我,道長怔匣,這世上最難降的妖魔是什么握联? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮每瞒,結(jié)果婚禮上金闽,老公的妹妹穿的比我還像新娘。我一直安慰自己剿骨,他們只是感情好代芜,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著浓利,像睡著了一般挤庇。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上贷掖,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天嫡秕,我揣著相機(jī)與錄音,去河邊找鬼苹威。 笑死淘菩,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播潮改,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼狭郑,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了汇在?” 一聲冷哼從身側(cè)響起翰萨,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎糕殉,沒想到半個(gè)月后亩鬼,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡阿蝶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年雳锋,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片羡洁。...
    茶點(diǎn)故事閱讀 38,566評論 1 339
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡玷过,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出筑煮,到底是詐尸還是另有隱情辛蚊,我是刑警寧澤,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布真仲,位于F島的核電站袋马,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏秸应。R本人自食惡果不足惜虑凛,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望软啼。 院中可真熱鬧桑谍,春花似錦、人聲如沸焰宣。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽匕积。三九已至,卻和暖如春榜跌,著一層夾襖步出監(jiān)牢的瞬間闪唆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工钓葫, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留悄蕾,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像帆调,于是被迫代替她去往敵國和親奠骄。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,440評論 2 348

推薦閱讀更多精彩內(nèi)容