RNAseq總體分析流程分為四步:
1)alignment of the reads to the genome
2)assembly of the alignments into full-length transcripts
3)quantification of the expression levels of each gene and transcript
4)calculation of the differences in expression for all genes among the different experiment conditions
HISAT+StringTie+Ballgown相比于TopHat2+Cufflinks速度要更快怔毛,使用的內(nèi)存更少,全局分析結(jié)果更佳促王。
【HISAT】將RNA-seq reads 比對到參考基因組上犀盟,尋找可變剪切位點。
【StringTie】將reads組裝呈全長或部分長度的轉(zhuǎn)錄本蝇狼,根據(jù)需要創(chuàng)造多個isoforms并預(yù)測基因和轉(zhuǎn)錄本的表達(dá)水平
【Ballgown】分析差異表達(dá)基因
試驗設(shè)計:
每一個處理設(shè)置6個重復(fù)阅畴,
需要注意的是3次重復(fù)是得到有效統(tǒng)計結(jié)果的最少重復(fù)次數(shù)。
支持時間進(jìn)程實驗和多個處理的分析迅耘。
作者以human Chr X的RNA-seq數(shù)據(jù)為例恶阴,對分析流程進(jìn)行講解,Chr X包含151M的基因組信息豹障,約占人類全基因組的5%冯事,有很多基因富集。
具體分析流程