轉(zhuǎn)錄組從下機(jī)數(shù)據(jù)到GO氓拼、kegg、GSEA

所有的命令粘貼于此抵碟，用于快速完成分析任務(wù)桃漾。具體軟件參數(shù)，見

#!/bin/bash
#復(fù)制下機(jī)數(shù)據(jù)到新的文件夾data ,盡量避免操作原始文件~/disk/lyb/
find ./Cleandata -name '*fq.gz'|xargs -i cp {} ./data
 
#以下內(nèi)容運(yùn)行目錄 ~/disk/lyb/data/
#1.質(zhì)控 

fastqc *.fq.gz -t 8 

 bg1='RNA_R1.fq.gz'
 bg2='RNA_R2.fq.gz'
 bef=(NS-1 NS-2 NS-3 WT-1 WT-2 WT-3)
for ((i=0;i<6;i++));
do
inA1=${bef[$i]}$bg1;
inA2=${bef[$i]}$bg2;
out1=${bef[$i]}"paired-R1.fq.gz";
out2=${bef[$i]}"paired-R2.fq.gz";
unpaired1=${bef[$i]}"unpaired-R1.fq.gz";
unpaired2=${bef[$i]}"unpaired-R2.fq.gz";
java -jar /home/guo/tool/Trimmomatic-0.38/trimmomatic-0.38.jar PE -threads 12 -phred33 $inA1 $inA2 $out1 $unpaired1 $out2 $unpaired2 ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36 
echo $inA1,$inA2,$out1,$out2,$unpaired1,$unpaired2;
done



#運(yùn)行目錄是 /disks/backup/chaim/maize/
/home/chaim/disk/soft/hisat2/extract_exons.py Zea_mays.B73_RefGen_v4.42.gtf > genome.exon
/home/chaim/disk/soft/hisat2/extract_splice_sites.py Zea_mays.B73_RefGen_v4.42.gtf > genome.ss
/home/chaim/disk/soft/hisat2/hisat2_extract_snps_haplotypes_VCF.py zea_mays.vcf> genome.snp

#2.1建立索引
hisat2-build -p 8 Zea_mays.B73_RefGen_v4.42.fa --ss genome.ss --exon genome.exon genome_tran &
#2.2比對
for((i=0;i<6;i++));
do
out1=${bef[$i]}"paired-R1.fq.gz";
out2=${bef[$i]}"paired-R2.fq.gz";
hisat2 -x /disks/backup/chaim/maize/genome_tran -p 16 -1 $out1 -2 $out2 -S ${bef[$i]}".map.sam" --dta-cufflinks --novel-splicesite-outfile ${bef[$i]}".nsplice"     
done
        
#第3步：用samtool拟逮，格式轉(zhuǎn)換撬统，將sam轉(zhuǎn)換為bam（共6條）
for((i=0;i<6;i++));
do
samtools sort -@ 8 -o ${bef[$i]}".map.bam" ${bef[$i]}".map.sam" 2>${bef[$i]}"samtool_out" 
done


#第4步裝配：用stringtie（共三輪）
#組裝轉(zhuǎn)錄本（6個分別比對到基因組）
 for((i=0;i<6;i++));
 do
 stringtie ${bef[$i]}".map.bam" -G /disks/backup/chaim/maize/Zea_mays.B73_RefGen_v4.42.gtf -p 8 -o ${bef[$i]}".gtf" &
 done
#合并各樣本（整合6個的結(jié)果成一個）
stringtie --merge -G /disks/backup/chaim/maize/Zea_mays.B73_RefGen_v4.42.gtf -p 8 -o merged.gtf NS-1.gtf NS-2.gtf NS-3.gtf WT-1.gtf WT-2.gtf WT-3.gtf 2>stringtie_merge &
#估計表達(dá)豐度（以第二輪的結(jié)果作為參考序列，6個分別比對）
 stringtie ${bef[$i]}".map.bam" -G merged.gtf -p 8 -b ${bef[$i]}"_out" -e -o ${bef[$i]}"-st.gtf" &
#第5步 生成CSV文件
#python路徑 
python2.7 /disks/backup/chaim/soft/prepDE.py -i gtf2
#第6步 deseq2進(jìn)行定量分析


source("https://bioconductor.org/biocLite.R")
biocLite("DESeq2")


#輸入數(shù)據(jù)
library(tidyverse)
library(DESeq2)
library(ggplot2)
#import data
#setwd("/home/chaim/disk/lyb/data/")
#setwd("/mnt/d/RNA-seq/")
setwd("D:/RNA-seq/")

countData <- as.matrix(read.csv("gene_count_matrix.csv",row.names="gene_id"))

condition <- factor(c(rep("NS",3),rep("WT",3)),levels = c("NS","WT"))
colData <- data.frame(row.names=colnames(countData),condition)
dds <- DESeqDataSetFromMatrix(countData = countData,colData = colData, design = ~ condition)
dds <- DESeq(dds)
#總體結(jié)果查看

res = results(dds)
res = res[order(res$pvalue),]

summary(res)
write.csv(res,file="All_results.csv")
table(res$padj<0.05)






#提取差異基因（DEGs）并進(jìn)行g(shù)ene Symbol注釋

diff_gene_deseq2 <- subset(res,padj<0.05 & abs(log2FoldChange)>1)
dim(diff_gene_deseq2)
write.csv(diff_gene_deseq2,file = "DEG_treat_vs_control.csv")




 # resdata <- res
 # threshold <- as.factor(ifelse(resdata$padj < 0.001 & abs(resdata$log2FoldChange) >= 2 ,ifelse(resdata$log2FoldChange >= 2 ,'Up','Down'),'Not'))
 # ggplot(resdata,aes(x=log2FoldChange,y=-log10(padj),colour=threshold)) + xlab("log2(Fold Change)")+ylab("-log10(qvalue)") + geom_point(size = 0.5,alpha=1) + ylim(0,200) + xlim(-12,12) + scale_color_manual(values=c("green","grey", "red"))




# #安裝biomaRt包
# source("http://bioconductor.org/biocLite.R")
# biocLite("biomaRt")
# install.packages('DT')
# #用bioMart對差異表達(dá)基因進(jìn)行注釋
# library("biomaRt")
# listMarts()
# 
# ensembl=useMart("ENSEMBL_MART_ENSEMBL")
# all_datasets <- listDatasets(ensembl)
# library(DT)
# datatable(all_datasets,options = list(searching=FALSE,pageLength=5,lengthMenu=c(5,10,15,20)))



#安裝clusterProfiler 用于GO/KEGG分析及GSEA
source("https://bioconductor.org/biocLite.R")
biocLite("clusterProfiler")
 biocLite("DOSE")
 require(DOSE)
 library(DO.db)
library(clusterProfiler)


 
 
 
 
 
 
 
 if (!requireNamespace("BiocManager", quietly = TRUE))
   install.packages("BiocManager")
 BiocManager::install("S4Vectors", version = "3.8")
 
 
 

#安裝annotationhub
if(!requireNamespace("BiocManager",quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("AnnotationHub", version = "3.8")

library(AnnotationHub)
require(AnnotationHub)
hub <- AnnotationHub()
query(hub,"zea mays")

maize <- hub[['AH66225']]
length(keys(maize))

columns(maize)

require(clusterProfiler)

bitr(keys(maize)[1],'GID',c("ACCNUM","ENTREZID","UNIGENE"),maize)


"ALIAS","EVIDENCE","EVIDENCELL",

#GO富集分析
#使用enrichGO



sample_genes <- keys(maize)

res=enrichGO(sample_genes,OrgDb=maize,pvalueCutoff=1,qvalueCutoff=1)

ego <- enrichGO(gene=row.names(diff_gene_deseq2),OrgDb = maize,keyType = "GENENAME",ont="MF")


ensids <- c("Zm00001d011037","Zm00001d035600","Zm00001d035599")
cols <- c("SYMBOL","GO")
select(maize,keys = ensids,columns = cols,keytype = "GENENAME")

#氣泡圖
dotplot(ego,font.size=5)
#網(wǎng)絡(luò)圖
enrichMap(ego,vertex.label.cex=1.2,layout=igraph::layout.kamada.kawai)
#GO圖額外安裝的包
biocLite("topGO")
biocLite("Rgraphviz")
plotGOgraph(ego)



#gseGO進(jìn)行GSEA分析







#快速匹配文件中唱歧，以gene開頭的行宪摧，并輸出其中的第3，12列內(nèi)容颅崩。
cat genome_table.txt |awk '$1 ~/gene/ {print $3,$12}' >gene_id

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末几于，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子沿后，更是在濱河造成了極大的恐慌沿彭，老刑警劉巖，帶你破解...
沈念sama閱讀 217,185評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件尖滚，死亡現(xiàn)場離奇詭異喉刘，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)漆弄，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,652評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門睦裳，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人撼唾，你說我怎么就攤上這事廉邑。” “怎么了倒谷？”我有些...
開封第一講書人閱讀 163,524評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵蛛蒙，是天一觀的道長。經(jīng)常有香客問我渤愁，道長牵祟，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,339評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任抖格，我火速辦了婚禮诺苹，結(jié)果婚禮上咕晋，老公的妹妹穿的比我還像新娘。我一直安慰自己筝尾，他們只是感情好捡需，可當(dāng)我...
茶點(diǎn)故事閱讀 67,387評論 6贊 391
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著筹淫，像睡著了一般站辉。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上损姜，一...
開封第一講書人閱讀 51,287評論 1贊 301
城市分裂傳說
那天饰剥，我揣著相機(jī)與錄音，去河邊找鬼摧阅。笑死汰蓉，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的棒卷。我是一名探鬼主播顾孽，決...
沈念sama閱讀 40,130評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼比规！你這毒婦竟也來了若厚？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,985評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤蜒什，失蹤者是張志新（化名）和其女友劉穎测秸，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體灾常，經(jīng)...
沈念sama閱讀 45,420評論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡霎冯，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,617評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了钞瀑。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沈撞。...
茶點(diǎn)故事閱讀 39,779評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖雕什，靈堂內(nèi)的尸體忽然破棺而出关串，到底是詐尸還是另有隱情，我是刑警寧澤监徘，帶...
沈念sama閱讀 35,477評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站吧碾，受9級特大地震影響凰盔，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜倦春，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,088評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一户敬、第九天我趴在偏房一處隱蔽的房頂上張望落剪。院中可真熱鬧，春花似錦尿庐、人聲如沸忠怖。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,716評論 0贊 22
一樁弒父案抄瑟，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽凡泣。三九已至，卻和暖如春皮假，著一層夾襖步出監(jiān)牢的瞬間鞋拟，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,857評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工惹资，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留贺纲，地道東北人。一個月前我還...
沈念sama閱讀 47,876評論 2贊 370
代替公主和親
正文我出身青樓褪测，卻偏偏與公主長得像猴誊，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子侮措，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,700評論 2贊 354

轉(zhuǎn)錄組從下機(jī)數(shù)據(jù)到GO、kegg捉腥、GSEA

轉(zhuǎn)錄組從下機(jī)數(shù)據(jù)到GO氓拼、kegg、GSEA

推薦閱讀更多精彩內(nèi)容