之前一直用的是Tophat + Htseq-count + Deseq2的分析組合來做rnaseq的回帖蛤签,確定基因表達(dá)量瘟芝,以及做差異基因的分析性宏。
但是踩验,tophat已經(jīng)是比較過時(shí)的軟件了涉茧,最重要過時(shí)原因是做一個(gè)回帖需要的時(shí)間太長了赴恨,而STAR所用的時(shí)間只是它的三十分之一左右。并且伴栓,輸出的bam是unsorted的伦连,需要自己再做一步bam file sorting。
而htseq-count只能得到gene read counts钳垮,而不能得到TPM或者RPKM的值來顯示每個(gè)基因的歸一化之后的表達(dá)量惑淳。而用RSEM軟件則很好的解決了這個(gè)問題。
因此饺窿,一個(gè)好的RNASeq分析流程就可以是:
1. 用Star做reads mapping
2. 用RSEM做基因表達(dá)量的quantification
3. 用DESeq2做基因差異分析
這一步的輸入文件就可以從STAR中來歧焦,因?yàn)镾TAR內(nèi)置了htseq-count的函數(shù),可以輸出gene read counts肚医。另外绢馍,DESeq2的performance在做差異基因的軟件里面表現(xiàn)得是最好的。