1.什么是蛋白互作挤牛?
在轉(zhuǎn)錄調(diào)控相關(guān)的文獻(xiàn)中莹痢,我們經(jīng)常能夠看到這樣的蛋白質(zhì)相互作用網(wǎng)絡(luò)(proteinprotein interaction network,PPInetwork)。具體而言竞膳,這些相關(guān)的文獻(xiàn)中首先通過RNA-seq航瞭、表達(dá)譜芯片或者蛋白質(zhì)組分析等,找到了在不同分組樣本間一系列的差異表達(dá)基因或蛋白顶猜。隨后沧奴,通過STRING數(shù)據(jù)庫(https://string-db.org/)檢索了編碼蛋白間可能的潛在相互作用,并構(gòu)建了蛋白質(zhì)相互作用網(wǎng)絡(luò)表示出來长窄,目的是描述這些基因或蛋白之間存在怎樣的相互關(guān)系,例如物理接觸纲菌、靶向調(diào)節(jié)等挠日,最終闡述生物體中有意義的分子調(diào)節(jié)網(wǎng)絡(luò)。
2.準(zhǔn)備文件:基因家族的蛋白序列翰舌,這里以MATE基因?yàn)槔?/h1>
打開STRING
依次點(diǎn)擊
3.?將Molecular Function嚣潜、Biological Process、Cellular Component三個(gè)文件分別打開椅贱,將勾選出來的分別復(fù)制到一個(gè)新的表格中懂算,新表格第一列填寫對應(yīng)的是這上述提到的三個(gè)名稱,具體示例文件如下?將Molecular Function庇麦、Biological Process计技、Cellular Component三個(gè)文件分別打開,將勾選出來的分別復(fù)制到一個(gè)新的表格中山橄,新表格第一列填寫對應(yīng)的是這上述提到的三個(gè)名稱垮媒,具體示例文件如下
?然后將準(zhǔn)備好的文件另存到桌面,文件命名為Module_GO
4.打開Rstudio航棱,依次輸入以下腳本
#setwd("C:/Users/86176/Desktop")
#library(grid)
#library(ggplot2)
#data?<-? read.table("Module_GO",header=T,sep="\t")
#data$Module<- factor(data$Module,levels = c("Cellular Component", "Molecular Function","Biological Process"))
#qplot(GO,number,colour = p_value, data = data,ylab="gene_number", xlab="GO enrichment",geom="jitter")+scale_colour_gradient2( low="red",mid="yellow", high="blue",midpoint=0.003)+theme_bw()+facet_wrap(~Module,scales="free_x",nrow=1)+theme(axis.text.x=element_text(angle=45,color="black",vjust=1,hjust=1),panel.grid.major.x = element_blank(),panel.grid.major.y = element_blank(),panel.grid.minor.y = element_blank(),strip.background = element_rect(fill = "#00CC33"))+theme(plot.margin=unit(c(30,0,20,20),"mm"))
5.KEGG
回到下載文件的那一步睡雇,下載KEGG Pathways,打開之后新建txt文本
打開,勾選中的這三列依次整理成下一個(gè)新表格
新建饮醇,命名為KEGG.txt
6.打開Rstudio它抱,依次輸入以下腳本
#setwd("C:/Users/86176/Desktop")
#library(grid)
#library(ggplot2)
#data <- read.table("KEGG.txt",header=T,sep="\t")
#ggplot(data = data, aes(x = Term, y= DEG_number,fill=Rich_factor,ylab="KEGG pathway"))+ geom_bar(stat="identity")+scale_fill_gradient2( low="blue",mid="yellow", high="red")+coord_flip()+theme_bw()