轉(zhuǎn)錄組從下機(jī)數(shù)據(jù)到GO氓拼、kegg、GSEA

所有的命令粘貼于此抵碟,用于快速完成分析任務(wù)桃漾。具體軟件參數(shù),見

#!/bin/bash
#復(fù)制下機(jī)數(shù)據(jù)到新的文件夾data ,盡量避免操作原始文件~/disk/lyb/
find ./Cleandata -name '*fq.gz'|xargs -i cp {} ./data
 
#以下內(nèi)容運(yùn)行目錄 ~/disk/lyb/data/
#1.質(zhì)控 

fastqc *.fq.gz -t 8 

 bg1='RNA_R1.fq.gz'
 bg2='RNA_R2.fq.gz'
 bef=(NS-1 NS-2 NS-3 WT-1 WT-2 WT-3)
for ((i=0;i<6;i++));
do
inA1=${bef[$i]}$bg1;
inA2=${bef[$i]}$bg2;
out1=${bef[$i]}"paired-R1.fq.gz";
out2=${bef[$i]}"paired-R2.fq.gz";
unpaired1=${bef[$i]}"unpaired-R1.fq.gz";
unpaired2=${bef[$i]}"unpaired-R2.fq.gz";
java -jar /home/guo/tool/Trimmomatic-0.38/trimmomatic-0.38.jar PE -threads 12 -phred33 $inA1 $inA2 $out1 $unpaired1 $out2 $unpaired2 ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36 
echo $inA1,$inA2,$out1,$out2,$unpaired1,$unpaired2;
done



#運(yùn)行目錄是 /disks/backup/chaim/maize/
/home/chaim/disk/soft/hisat2/extract_exons.py Zea_mays.B73_RefGen_v4.42.gtf > genome.exon
/home/chaim/disk/soft/hisat2/extract_splice_sites.py Zea_mays.B73_RefGen_v4.42.gtf > genome.ss
/home/chaim/disk/soft/hisat2/hisat2_extract_snps_haplotypes_VCF.py zea_mays.vcf> genome.snp

#2.1建立索引
hisat2-build -p 8 Zea_mays.B73_RefGen_v4.42.fa --ss genome.ss --exon genome.exon genome_tran &
#2.2比對
for((i=0;i<6;i++));
do
out1=${bef[$i]}"paired-R1.fq.gz";
out2=${bef[$i]}"paired-R2.fq.gz";
hisat2 -x /disks/backup/chaim/maize/genome_tran -p 16 -1 $out1 -2 $out2 -S ${bef[$i]}".map.sam" --dta-cufflinks --novel-splicesite-outfile ${bef[$i]}".nsplice"     
done
        
#第3步:用samtool拟逮,格式轉(zhuǎn)換撬统,將sam轉(zhuǎn)換為bam(共6條)
for((i=0;i<6;i++));
do
samtools sort -@ 8 -o ${bef[$i]}".map.bam" ${bef[$i]}".map.sam" 2>${bef[$i]}"samtool_out" 
done


#第4步裝配:用stringtie(共三輪)
#組裝轉(zhuǎn)錄本(6個分別比對到基因組)
 for((i=0;i<6;i++));
 do
 stringtie ${bef[$i]}".map.bam" -G /disks/backup/chaim/maize/Zea_mays.B73_RefGen_v4.42.gtf -p 8 -o ${bef[$i]}".gtf" &
 done
#合并各樣本(整合6個的結(jié)果成一個)
stringtie --merge -G /disks/backup/chaim/maize/Zea_mays.B73_RefGen_v4.42.gtf -p 8 -o merged.gtf NS-1.gtf NS-2.gtf NS-3.gtf WT-1.gtf WT-2.gtf WT-3.gtf 2>stringtie_merge &
#估計表達(dá)豐度(以第二輪的結(jié)果作為參考序列,6個分別比對)
 stringtie ${bef[$i]}".map.bam" -G merged.gtf -p 8 -b ${bef[$i]}"_out" -e -o ${bef[$i]}"-st.gtf" &
#第5步 生成CSV文件
#python路徑 
python2.7 /disks/backup/chaim/soft/prepDE.py -i gtf2
#第6步 deseq2進(jìn)行定量分析


source("https://bioconductor.org/biocLite.R")
biocLite("DESeq2")


#輸入數(shù)據(jù)
library(tidyverse)
library(DESeq2)
library(ggplot2)
#import data
#setwd("/home/chaim/disk/lyb/data/")
#setwd("/mnt/d/RNA-seq/")
setwd("D:/RNA-seq/")

countData <- as.matrix(read.csv("gene_count_matrix.csv",row.names="gene_id"))

condition <- factor(c(rep("NS",3),rep("WT",3)),levels = c("NS","WT"))
colData <- data.frame(row.names=colnames(countData),condition)
dds <- DESeqDataSetFromMatrix(countData = countData,colData = colData, design = ~ condition)
dds <- DESeq(dds)
#總體結(jié)果查看

res = results(dds)
res = res[order(res$pvalue),]

summary(res)
write.csv(res,file="All_results.csv")
table(res$padj<0.05)






#提取差異基因(DEGs)并進(jìn)行g(shù)ene Symbol注釋

diff_gene_deseq2 <- subset(res,padj<0.05 & abs(log2FoldChange)>1)
dim(diff_gene_deseq2)
write.csv(diff_gene_deseq2,file = "DEG_treat_vs_control.csv")




 # resdata <- res
 # threshold <- as.factor(ifelse(resdata$padj < 0.001 & abs(resdata$log2FoldChange) >= 2 ,ifelse(resdata$log2FoldChange >= 2 ,'Up','Down'),'Not'))
 # ggplot(resdata,aes(x=log2FoldChange,y=-log10(padj),colour=threshold)) + xlab("log2(Fold Change)")+ylab("-log10(qvalue)") + geom_point(size = 0.5,alpha=1) + ylim(0,200) + xlim(-12,12) + scale_color_manual(values=c("green","grey", "red"))




# #安裝biomaRt包
# source("http://bioconductor.org/biocLite.R")
# biocLite("biomaRt")
# install.packages('DT')
# #用bioMart對差異表達(dá)基因進(jìn)行注釋
# library("biomaRt")
# listMarts()
# 
# ensembl=useMart("ENSEMBL_MART_ENSEMBL")
# all_datasets <- listDatasets(ensembl)
# library(DT)
# datatable(all_datasets,options = list(searching=FALSE,pageLength=5,lengthMenu=c(5,10,15,20)))



#安裝clusterProfiler 用于GO/KEGG分析及GSEA
source("https://bioconductor.org/biocLite.R")
biocLite("clusterProfiler")
 biocLite("DOSE")
 require(DOSE)
 library(DO.db)
library(clusterProfiler)


 
 
 
 
 
 
 
 if (!requireNamespace("BiocManager", quietly = TRUE))
   install.packages("BiocManager")
 BiocManager::install("S4Vectors", version = "3.8")
 
 
 

#安裝annotationhub
if(!requireNamespace("BiocManager",quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("AnnotationHub", version = "3.8")

library(AnnotationHub)
require(AnnotationHub)
hub <- AnnotationHub()
query(hub,"zea mays")

maize <- hub[['AH66225']]
length(keys(maize))

columns(maize)

require(clusterProfiler)

bitr(keys(maize)[1],'GID',c("ACCNUM","ENTREZID","UNIGENE"),maize)


"ALIAS","EVIDENCE","EVIDENCELL",

#GO富集分析
#使用enrichGO



sample_genes <- keys(maize)

res=enrichGO(sample_genes,OrgDb=maize,pvalueCutoff=1,qvalueCutoff=1)

ego <- enrichGO(gene=row.names(diff_gene_deseq2),OrgDb = maize,keyType = "GENENAME",ont="MF")


ensids <- c("Zm00001d011037","Zm00001d035600","Zm00001d035599")
cols <- c("SYMBOL","GO")
select(maize,keys = ensids,columns = cols,keytype = "GENENAME")

#氣泡圖
dotplot(ego,font.size=5)
#網(wǎng)絡(luò)圖
enrichMap(ego,vertex.label.cex=1.2,layout=igraph::layout.kamada.kawai)
#GO圖額外安裝的包
biocLite("topGO")
biocLite("Rgraphviz")
plotGOgraph(ego)



#gseGO進(jìn)行GSEA分析







#快速匹配文件中唱歧,以gene開頭的行宪摧,并輸出其中的第3,12列內(nèi)容颅崩。
cat genome_table.txt |awk '$1 ~/gene/ {print $3,$12}' >gene_id
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末几于,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子沿后,更是在濱河造成了極大的恐慌沿彭,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件尖滚,死亡現(xiàn)場離奇詭異喉刘,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)漆弄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門睦裳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人撼唾,你說我怎么就攤上這事廉邑。” “怎么了倒谷?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵蛛蒙,是天一觀的道長。 經(jīng)常有香客問我渤愁,道長牵祟,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任抖格,我火速辦了婚禮诺苹,結(jié)果婚禮上咕晋,老公的妹妹穿的比我還像新娘。我一直安慰自己筝尾,他們只是感情好捡需,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著筹淫,像睡著了一般站辉。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上损姜,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天饰剥,我揣著相機(jī)與錄音,去河邊找鬼摧阅。 笑死汰蓉,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的棒卷。 我是一名探鬼主播顾孽,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼比规!你這毒婦竟也來了若厚?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤蜒什,失蹤者是張志新(化名)和其女友劉穎测秸,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體灾常,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡霎冯,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了钞瀑。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沈撞。...
    茶點(diǎn)故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖雕什,靈堂內(nèi)的尸體忽然破棺而出关串,到底是詐尸還是另有隱情,我是刑警寧澤监徘,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站吧碾,受9級特大地震影響凰盔,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜倦春,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一户敬、第九天 我趴在偏房一處隱蔽的房頂上張望落剪。 院中可真熱鬧,春花似錦尿庐、人聲如沸忠怖。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽凡泣。三九已至,卻和暖如春皮假,著一層夾襖步出監(jiān)牢的瞬間鞋拟,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工惹资, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留贺纲,地道東北人。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓褪测,卻偏偏與公主長得像猴誊,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子侮措,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容