具體的介紹和使用方法及原理:使用rmats進(jìn)行可變剪切的分析(摘自生信修煉手冊)
原理:我理解的原理是他利用了3-4個(gè)外顯子,檢測哪個(gè)是exon inclusion isoform笆载,哪個(gè)是exon skipping isoform,定量一下剪切百分率(PSI)吧慢,比較兩個(gè)樣本的PSI的差是不是大于自己設(shè)定的閾值(這一點(diǎn)不理解溃卡,是哪兩個(gè)isoform之間的對比沮焕,為什么是兩個(gè)樣本里的对室,不應(yīng)該是對應(yīng)的exon inclusion isoform和exon skipping isoform之間的對比嗎参滴?)
軟件用法示例:
1.數(shù)據(jù)下載:https://sourceforge.net/projects/rnaseq-mats/files/latest/download
gtf文件:Homo_sapiens.Ensembl.GRCh37.75.gtf
2.應(yīng)該安裝python2.7.x版本
3.基本用法:1)先判斷用哪個(gè)版本的python解釋程序
出現(xiàn)1114111說明用rMATS-turbo-Linux-UCS4
出現(xiàn)65535說明用rMATS-turbo-Linux-UCS2
用bam文件:python rMATS-turbo-xxx-UCSx/rmats.py --b1 b1.txt --b2 b2.txt -gtf gtf/Homo_sapiens.Ensembl.GRCh37.75.gtf -od bam_test -t paired --readLength 50 --cstat 0.0001 --libType fr-unstranded
特別注意:b1.txt和b2.txt保存的是每個(gè)樣本比對參考基因組的bam文件的路徑强岸,每個(gè)里面可以包含多個(gè)bam文件示例如下
具體參數(shù)意義:
遇到的問題:結(jié)果輸出文件只有表頭,沒有內(nèi)容砾赔,不知道怎么解決