NOTE:
所有Tombo命令也可用于DRS reads,但必須為剪切的轉(zhuǎn)錄本提供轉(zhuǎn)錄組參考序列扫沼。
運(yùn)行tombo-h查看所有tombo命令,
運(yùn)行tombo [command group] -h查看每個(gè)組中的所有命令日裙,
并運(yùn)行tombo [command group] [comand]-h獲取每個(gè)tombo命令參數(shù)的幫助逛腿。
Tombo當(dāng)前無(wú)法處理spliced alignments。因此蝴蜓,處理RNA數(shù)據(jù)需要為具有剪接轉(zhuǎn)錄產(chǎn)物的生物體提供transcriptome (NOT genome) reference碟绑。
在Tombo框架內(nèi)處理RNA數(shù)據(jù)需要特別小心。在進(jìn)行RNA處理時(shí)要考慮的主要事項(xiàng)是必須提供轉(zhuǎn)錄組參考茎匠,因?yàn)椴恢С謘pliced mapping格仲。Tombo框架中缺少剪接映射支持是識(shí)別修飾RNA堿基的一個(gè)有意識(shí)的決定。這是因?yàn)檗D(zhuǎn)錄組是檢測(cè)修飾RNA堿基的自然環(huán)境诵冒。
當(dāng)修飾的RNA堿基投射到基因組參考上時(shí)凯肋,任何潛在的轉(zhuǎn)錄isoform特異性修飾信息丟失或信號(hào)被稀釋。保留亞型特異性修飾堿基檢測(cè)的可能性是選擇強(qiáng)制將修飾堿基映射到轉(zhuǎn)錄組的一個(gè)原因汽馋。備選外顯子邊緣的區(qū)域也有不同的預(yù)期信號(hào)水平侮东,因此午笛,這些位置計(jì)算的基因組統(tǒng)計(jì)數(shù)據(jù)將很難處理成邏輯輸出。加工過(guò)程也會(huì)對(duì)映射splice boundaries的位移非常敏感苗桂,這可能隨nanopore reads而變化。
研究isoform特異性修飾堿基的工具是Tombo框架內(nèi)的未來(lái)目標(biāo)告组。這確實(shí)給Tombo RNA數(shù)據(jù)的下游處理帶來(lái)了一些信息挑戰(zhàn)煤伟。推薦的Tombo RNA處理pipeline將很快發(fā)布在這里,以幫助整合性修飾RNA處理 與其他基因組生物信息學(xué)工具更加簡(jiǎn)化木缝。
第二個(gè)次要注意事項(xiàng)是便锨,由于RNA目前在3'到5'方向上測(cè)序;因此我碟,在訪問(wèn)Tombo re-squiggled 的原始信號(hào)數(shù)據(jù)時(shí)放案,必須特別小心。原始信號(hào)(來(lái)自MinKNOW)和稱為albacore堿基的事件以與基因組相反的方向存儲(chǔ)(3'到5'的reads 映射到正基因組鏈)矫俺。出于幾個(gè)實(shí)際原因吱殉,RNA數(shù)據(jù)的Tombo事件以相反的方向存儲(chǔ)(對(duì)應(yīng)于基因組鏈序列方向,而不是測(cè)序時(shí)間方向)厘托。因此友雳,如果要將Tombo事件與原始信號(hào)進(jìn)行比較,則必須反轉(zhuǎn)原始信號(hào)铅匹。Tombo RNA模型也存儲(chǔ)在這個(gè)方向上押赊,因此與在序列時(shí)間方向上處理數(shù)據(jù)的一些其他RNA HMM信號(hào)水平模型相比,可能被認(rèn)為是反向的包斑。
RNA Processing Workflow
由于Tombo RNA處理帶來(lái)了獨(dú)特的信息挑戰(zhàn)流礁,推薦的處理pipeline將很快發(fā)布在這里。
該pipeline適用于希望處理來(lái)自基因組序列參考和基因注釋文件(GTF或GFF)的樣本的用戶罗丰。對(duì)于成功處理轉(zhuǎn)錄組 reference數(shù)據(jù)的用戶神帅,此處理workflow將不適用。
該管道旨在解決RNA修飾堿基檢測(cè)的大多數(shù)用例丸卷,即將Tombo結(jié)果移植到與基因組瀏覽器兼容的格式枕稀。請(qǐng)盡快回來(lái)查看推薦的Tombo RNA處理管道!
這條pipeline可能會(huì)建在R/bioconductor ensembldb包上谜嫉。該軟件包允許創(chuàng)建自定義數(shù)據(jù)庫(kù)以及基因組和轉(zhuǎn)錄組坐標(biāo)之間的映射萎坷。為了將Tombo RNA結(jié)果投影到基因組坐標(biāo)空間,建議使用該軟件的功能沐兰。不久將提供基于此包的完整Tombo pipeline的完整教程/示例腳本哆档。