環(huán)狀RNA的識(shí)別包含了序列比對和環(huán)狀RNA預(yù)測兩步老充,該軟件目前更新到了v2版本葡盗,相比v1版本,用法有較大變化啡浊。在v1版本中只支持tophat-fusion和STAR兩款軟件進(jìn)行序列比對來識(shí)別junction reads,在v2版本中戳粒,擴(kuò)展到了以下5種軟件
- TopHat2/TopHat-Fusion
- STAR
- BWA
- MapSplice
- segemehl
原理
- Align用于將序列比對到參考基因組上;
- Parse用于從比對結(jié)果中挑選junction reads;
- Annotate用于預(yù)測環(huán)狀RNA;
- Assemble用于組裝環(huán)狀RNA的轉(zhuǎn)錄本序列;
- Denovo根據(jù)序列組裝結(jié)果虫啥,識(shí)別新的環(huán)狀RNA和分析環(huán)狀RNA上的可變剪切事件
安裝
- pip install circexplorer2
- conda install circexplorer2 --channel bioconda
該軟件分為以下5個(gè)功能模塊:
- Align:用于將序列比對到參考基因組上
- Parse:用于從比對結(jié)果中挑選junction reads
- Annotate:用于預(yù)測環(huán)狀RNA
- Assemble:用于組裝環(huán)狀RNA的轉(zhuǎn)錄本序列
- Denovo:根據(jù)序列組裝結(jié)果蔚约,識(shí)別新的環(huán)狀RNA和分析環(huán)狀RNA上的可變剪切事件
使用方法
1. Align
雖然支持多款序列比對軟件,但是由于tophat的結(jié)果更方便后續(xù)的cufflinks軟件進(jìn)行分析涂籽,官方推薦使用tophat來進(jìn)行比對苹祟。針對單端序列的比對,代碼如下
CIRCexplorer2 align \
-G hg19.gtf \
-i bowtie1_index \
-j bowtie2_index \
-f RNA_seq.fastq \
> CIRCexplorer2_align.log
值得注意的是评雌,align模塊僅提供了針對單端序列使用tophat進(jìn)行比對的功能树枫,如果你是雙端測序的結(jié)果或者想要使用其他軟件,只能是自己手工進(jìn)行比對景东,這里比較推薦STAR軟件砂轻,速度較快,缺點(diǎn)就是內(nèi)存消耗較大斤吐。
2. parse
parse用于解析序列比對的結(jié)果搔涝,支持多款軟件,以常用的STAR為例和措,代碼如下
CIRCexplorer2 parse \
-t STAR \
Chimeric.out.junction \
> CIRCexplorer2_parse.log
對于其他軟件的用法庄呈,具體請參考官方文檔,無論是什么比對軟件派阱,該命令最終都會(huì)生成以下文件
back_spliced_junction.bed
3. annotation
這一步就是根據(jù)已知的線性轉(zhuǎn)錄本信息诬留,識(shí)別環(huán)狀RNA,所以需要提供參考基因組對應(yīng)的注釋文件贫母,官方也提供了腳本來幫助我們下載文兑,用法如下
fetch_ucsc.py hg19 ref hg19_ref.txt
預(yù)測環(huán)狀RNA的代碼如下
CIRCexplorer2 annotate \
-r hg19_ref.txt \
-g hg19.fa \
-b back_spliced_junction.bed \
-o circularRNA_known.txt \
> CIRCexplorer2_annotate.log
-o
參數(shù)為輸出結(jié)果,內(nèi)容示意如下
每列的含義如下所示
如果你只是想要使用這個(gè)軟件來預(yù)測環(huán)狀RNA,那么多款序列比對軟件都可以選擇腺劣,但是你想要使用完整功能绿贞,則必須使用tophat來進(jìn)行比對。
參考資料: