轉(zhuǎn)錄組分析(8) - 可變剪接

真核生物大部分基因含有內(nèi)含子鳄哭,轉(zhuǎn)錄完成后產(chǎn)生的mRNA前體需要經(jīng)過一系列復(fù)雜的加工泰佳,成為成熟的mRNA,轉(zhuǎn)移到細(xì)胞質(zhì)中才能發(fā)揮功能闻坚」料瑁可變剪接(Alternative Splicing,AS)是指從一個(gè)mRNA前體中通過不同的剪接方式窿凤,對(duì)外顯子和內(nèi)含子進(jìn)行組合仅偎,產(chǎn)生不同的mRNA剪接異構(gòu)體的過程■ㄊ猓可變剪接受到具有特殊結(jié)構(gòu)域的順式調(diào)控元件(RNA motif)和識(shí)別這些motif的RNA結(jié)合蛋白(RNA binding protein)調(diào)控 橘沥。RNA-seq通常是二代轉(zhuǎn)錄組,可以通過高深度的測(cè)序數(shù)據(jù)組裝構(gòu)建轉(zhuǎn)錄本序列夯秃,預(yù)測(cè)外顯子與內(nèi)含子的結(jié)構(gòu)并識(shí)別出可變剪接模式座咆,假陽性不小。相比之下仓洼,三代全長轉(zhuǎn)錄組利用其讀長更長的優(yōu)勢(shì)介陶,可以直接讀取轉(zhuǎn)錄本的全長序列,無需打斷色建、組裝哺呜,直接獲得全長轉(zhuǎn)錄本的結(jié)構(gòu)信息,能夠更加準(zhǔn)確的分析生物體內(nèi)存在可變剪接事件镀岛。選擇哪種測(cè)序方式需要考慮實(shí)際情況綜合考慮弦牡。

rMATS

rMATS是一款對(duì)RNA-Seq數(shù)據(jù)進(jìn)行差異可變剪切分析的軟件友驮。其通過rMATS統(tǒng)計(jì)模型對(duì)不同樣本(有生物學(xué)重復(fù)的)進(jìn)行可變剪切事件的表達(dá)定量,然后以likelihood-ratio test計(jì)算P value來表示兩組樣品在IncLevel(Inclusion Level)水平上的差異(從公式上來看驾锰,IncLevel跟PSI的定義也是類似的)卸留,lncLevel并利用Benjamini Hochberg算法對(duì)p value進(jìn)行校正得FDR值。

安裝
conda activate py2
conda install rmats
conda install rmats2sashimiplot
運(yùn)行
mkdir -p $output/4.4.4_rmats
echo $output/4.3.1_Tophat2/A_rep1.uniq.sorted.bam,$output/4.3.1_Tophat2/A_rep2.uniq.sorted.bam,$output/4.4.1_Tophat2/A_rep3.uniq.sorted.bam>$output/4.4.4_rmats/A.txt
echo $output/4.4.1_Tophat2/B_rep1.uniq.sorted.bam,$output/4.4.1_Tophat2/B_rep2.uniq.sorted.bam,$output/4.4.1_Tophat2/B_rep3.uniq.sorted.bam>$output/4.4.4_rmats/B.txt
mkdir -p $output/4.4.4_rmats/A_vs_B
rmats.py --b1 $output/4.4.4_rmats/A.txt --b2 $output/4.4.4_rmats/B.txt --gtf $dir_geo/4_Bowtie2/XXX.genome.gtf --od $output/4.4.4_rmats/A_vs_B -t paired --readLength 125 --cstat 0.0001 --nthread 6 --tmp $output/4.4.4_rmats/A_vs_B
mkdir -p $output/4.4.5_rmats2sashimiplot/
mkdir -p $output/4.4.5_rmats2sashimiplot/A_vs_B
rmats2sashimiplot --b1 $output/4.4.1_Tophat2/A.uniq.sorted.bam,$output/4.4.1_Tophat2/A_rep2.uniq.sorted.bam,$output/4.4.1_Tophat2/A_rep3.uniq.sorted.bam --b2 $output/4.4.1_Tophat2/B_rep1.uniq.sorted.bam,$output/4.4.1_Tophat2/B_rep2.uniq.sorted.bam,$output/4.4.1_Tophat2/B_rep3.uniq.sorted.bam -t SE -e $output/4.4.4_rmats/A_vs_B/SE.MATS.JC.txt --l1 A --l2 B --exon_s 1 --intron_s 1 -o $output/4.4.5_rmats2sashimiplot/A_vs_B 
結(jié)果

MATS的結(jié)果文件是以各個(gè)可變剪切事件的分布的椭豫,主要由AS_Event.MATS.JC.txt耻瑟,AS_Event.MATS.JCEC.txt,fromGTF.AS_Event.txt赏酥,JC.raw.input.AS_Event.txt喳整,JCEC.raw.input.AS_Event.txt這幾類;其中JC和JCEC的區(qū)別在于前者考慮跨越剪切位點(diǎn)的reads裸扶,而后者不僅考慮前者的reads還考慮到比對(duì)到?jīng)]有跨越剪切位點(diǎn)的reads框都,但一般僅使用最重要的.Event.MATS.JC.txt的結(jié)果(如果只是單純的比較兩組樣品間可變剪切的差異的話;最后采用rmats2sashimiplot對(duì)結(jié)果繪圖呵晨。

ASprofile

ASprfile軟件對(duì)由StringTie對(duì)Hisat2的比對(duì)結(jié)果進(jìn)行拼接的結(jié)果文件獲取每個(gè)樣本存在的可變剪接類型及相應(yīng)表達(dá)量魏保。

安裝
wget https://ccb.jhu.edu/software/ASprofile/ASprofile.tar.gz
tar -zxvf ASprofile.tar.gz
cd ASprofile.*

Leafcutter

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市摸屠,隨后出現(xiàn)的幾起案子谓罗,更是在濱河造成了極大的恐慌,老刑警劉巖季二,帶你破解...
    沈念sama閱讀 219,490評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件檩咱,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡胯舷,警方通過查閱死者的電腦和手機(jī)刻蚯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來桑嘶,“玉大人芦倒,你說我怎么就攤上這事〔霍妫” “怎么了兵扬?”我有些...
    開封第一講書人閱讀 165,830評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長口蝠。 經(jīng)常有香客問我器钟,道長,這世上最難降的妖魔是什么妙蔗? 我笑而不...
    開封第一講書人閱讀 58,957評(píng)論 1 295
  • 正文 為了忘掉前任傲霸,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘昙啄。我一直安慰自己穆役,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評(píng)論 6 393
  • 文/花漫 我一把揭開白布梳凛。 她就那樣靜靜地躺著耿币,像睡著了一般。 火紅的嫁衣襯著肌膚如雪韧拒。 梳的紋絲不亂的頭發(fā)上淹接,一...
    開封第一講書人閱讀 51,754評(píng)論 1 307
  • 那天,我揣著相機(jī)與錄音叛溢,去河邊找鬼塑悼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛楷掉,可吹牛的內(nèi)容都是我干的厢蒜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼烹植,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼郭怪!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起刊橘,我...
    開封第一講書人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎颂鸿,沒想到半個(gè)月后促绵,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,847評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡嘴纺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評(píng)論 3 338
  • 正文 我和宋清朗相戀三年败晴,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片栽渴。...
    茶點(diǎn)故事閱讀 40,137評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡尖坤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出闲擦,到底是詐尸還是另有隱情慢味,我是刑警寧澤,帶...
    沈念sama閱讀 35,819評(píng)論 5 346
  • 正文 年R本政府宣布墅冷,位于F島的核電站纯路,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏寞忿。R本人自食惡果不足惜驰唬,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧叫编,春花似錦辖佣、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至恃逻,卻和暖如春雏搂,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背寇损。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評(píng)論 1 272
  • 我被黑心中介騙來泰國打工凸郑, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人矛市。 一個(gè)月前我還...
    沈念sama閱讀 48,409評(píng)論 3 373
  • 正文 我出身青樓芙沥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親浊吏。 傳聞我的和親對(duì)象是個(gè)殘疾皇子而昨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 作者:椰子糖審稿:童蒙編輯:amethyst 可變剪切能夠產(chǎn)生多種類型的mRNA,因此一個(gè)基因就可以產(chǎn)生多種不同的...
    生信阿拉丁閱讀 7,628評(píng)論 3 15
  • 可變剪切介紹: 什么是基因的可變剪切找田? 有些基因的前體mRNA(pre-mRNA)通過不同的剪接方式(選擇不同的剪...
    堯小飛閱讀 8,881評(píng)論 7 25
  • 可變剪切定義 有些基因的一個(gè)mRNA前體通過不同的剪接方式(選擇不同的剪接位點(diǎn))產(chǎn)生不同的mRNA剪接異構(gòu)體歌憨,這一...
    生信修煉小站閱讀 18,477評(píng)論 1 19
  • 1hisat2 1.1介紹 ? 總體上來說HISAT利用了BWA和Bowtie的算法,同時(shí)解決了mRNA中不存在內(nèi)...
    nnlrl閱讀 6,771評(píng)論 4 4
  • 今天感恩節(jié)哎墩衙,感謝一直在我身邊的親朋好友务嫡。感恩相遇!感恩不離不棄漆改。 中午開了第一次的黨會(huì)心铃,身份的轉(zhuǎn)變要...
    迷月閃星情閱讀 10,567評(píng)論 0 11