tags: tophat-fusion
tophat-fusion 報(bào)錯(cuò)
RNA-seq 數(shù)據(jù)檢測(cè)融合基因莱睁,在 tophat-fusion 這一步報(bào)錯(cuò):
./SeqAn-1.4.2/seqan/basic/basic_exception.h:236 FAILED! (Uncaught exception of type St12out_of_range: basic_string::substr)
第一次運(yùn)行的是 tophat 報(bào)這個(gè)錯(cuò)谴蔑,然后換用 tophat2 重新運(yùn)行搁骑,還是報(bào)這個(gè)錯(cuò)。
google 之后發(fā)現(xiàn) biostar 有人給出了解決辦法,很簡(jiǎn)單锨天,用tophat2.1.0這個(gè)版本就好了!我檢查了一下自己的 tophat2 是 2.1.1 的剃毒,重新下載 tophat2.1.0 然后安裝重跑病袄,浪費(fèi)了我半天時(shí)間的 bug 就解決了搂赋。
為什么 tophat1 和 tophat2.1.1 都在這里出問題,而唯獨(dú) tophat2.1.0 順利跑完了……
tophat-fusion-post 數(shù)據(jù)庫(kù)配置
從 tophat-fusion 官方站點(diǎn)下載 ensGene.txt 和 refGene.txt益缠,以及 blast 數(shù)據(jù)庫(kù)中的 human*, nt*, other* 脑奠,這些數(shù)據(jù)庫(kù)一個(gè)都不能少。
更新一個(gè)注意事項(xiàng)
tophat-fusion-post 是用來(lái)過濾 tophat-fusion 得到的融合基因初步位點(diǎn)幅慌,由于 tophat-fusion-post 這一步用的數(shù)據(jù)庫(kù)是 hg18, hg19, hg38 這一系列的宋欺,因此在前一步 tophat-fusion 必須也使用 hg 系列來(lái)作參考基因組,否則經(jīng)過過濾之后得不到任何結(jié)果胰伍,0 位點(diǎn)輸出齿诞,而且軟件并不會(huì)給出任何錯(cuò)誤提示。
想必很多用 tophat 分析融合基因的人都被這個(gè)點(diǎn)坑過骂租,我分析很有可能是跟參考基因組的染色體名稱是否有 chr 有關(guān)系 ……
要規(guī)避 phred-33 和 phred-64 之坑祷杈,還要規(guī)避參考基因組的染色體名稱有無(wú) chr 前綴之坑,真是讓人哭笑不得渗饮。