提到RNA-Seq差異表達(dá)分析纠亚,人們首先想到的是兩個(gè)實(shí)驗(yàn)條件下的差異表達(dá)劫哼,比如說(shuō)癌組織與癌旁等洋只。但有時(shí)候研究人員想要探究某種實(shí)驗(yàn)處理方法在不同時(shí)間下對(duì)目標(biāo)產(chǎn)生的影響划乖,就會(huì)出現(xiàn)時(shí)序RNA-Seq贬养,也就有了RNA sequencing time course data。傳統(tǒng)兩個(gè)實(shí)驗(yàn)條件下的差異表達(dá)已經(jīng)研究的很成熟了琴庵,但時(shí)序RNA-Seq的差異表達(dá)分析尚處于起步階段误算,許多研究都采用兩兩比較的方式進(jìn)行分析仰美。
目前,在omictools網(wǎng)站上列舉了12個(gè)與時(shí)序RNA-Seq分析相關(guān)的工具[Figure 1]儿礼,但隨之而來(lái)的問(wèn)題就是咖杂,哪些工具好用,以及是否比傳統(tǒng)的兩兩比較更有優(yōu)勢(shì)蚊夫。
2017年诉字,在『Briefings in Bioinformatics』上發(fā)表了一篇論文,對(duì)這些工具進(jìn)行了比較知纷。
首先還是給出文章:
Comparative analysis of differential gene expression tools for RNA sequencing time course data
文章對(duì)AdaptiveGP (nsgp)壤圃、DyNB、EBSeqHMM琅轧、FunPat伍绳、ImpulseDE2、lmms鹰晨、Next maSigPro 墨叛、splineTimeR (splineTC)、TimeSeq以及兩兩配對(duì)分析的工具edgeR/DESeq2 進(jìn)行了比較模蜡。
簡(jiǎn)單來(lái)說(shuō)漠趁,文章先生成一個(gè)模擬數(shù)據(jù)集,來(lái)對(duì)上面提到的工具進(jìn)行差異表達(dá)的比較分析忍疾。接著將時(shí)序分析工具與傳統(tǒng)兩兩比較的軟件進(jìn)行了對(duì)比闯传。最后在一個(gè)真實(shí)的數(shù)據(jù)集(GSE69822)上測(cè)試表現(xiàn)最好的軟件。
文章最后得出結(jié)論:除了ImpulseDE2卤妒、splineTC甥绿、maSigPro, TC RNA-seq tools只能部分解釋數(shù)據(jù)集的時(shí)序特征。意料之外的是则披,時(shí)間點(diǎn)的兩兩比較在標(biāo)準(zhǔn)的實(shí)驗(yàn)條件下仍然是最穩(wěn)定共缕、準(zhǔn)確的方法。唯一的例外是ImpulseDE2士复,但有更多的噪音图谷。增加樣本能夠提高所有軟件的表現(xiàn),但增多時(shí)間點(diǎn)只能增強(qiáng)maSigPro和splineTC阱洪。因此便贵,目前的time course tools只有在時(shí)間點(diǎn)設(shè)置較多的時(shí)候比傳統(tǒng)兩兩比較的方法好。
we conclude that combining candidates of several methods is the most reliable and cost-effective trade-off to increasing replicates or time points.
文章最后給出key point:
- Time course analysis tools are outperformed by the classical pairwise comparison approach on short time series, except of ImpulseDE2.
- Overlapping of candidate lists between similar tools reduced FPs to a greater extent than TPs.
- splineTC and maSigPro have best overall performance on long time series data.
該文章所有的數(shù)據(jù)冗荸、腳本都可以下載學(xué)習(xí)承璃,有時(shí)間建議大家看一看~~~