生信分析30:基于二代轉(zhuǎn)錄組測序檢測APA事件

本次推送是文獻(xiàn)分享30的對應(yīng)內(nèi)容刹枉。

多聚腺苷酸化 (ployA) 是真核生物中一種重要的轉(zhuǎn)錄后調(diào)控機(jī)制幻工,它調(diào)節(jié) pre-mRNA的成熟煞茫。?

對于很多基因來說态罪,該過程可以發(fā)生在多個(gè)位點(diǎn)噩茄,即產(chǎn)生不同長度的成熟mRNA,這被稱為選擇性多聚腺苷酸化(APA)复颈。?

APA事件已經(jīng)被證實(shí)在基因組中廣泛存在绩聘,如超過70%的擬南芥基因被發(fā)現(xiàn)有大于1個(gè)的ployA位點(diǎn)。?

雖然在多數(shù)情況下APA并不會(huì)改變mRNA的蛋白編碼區(qū)域耗啦,但卻可能會(huì)破壞位于3'-UTRs區(qū)域中的重要順式調(diào)控元件凿菩,最終導(dǎo)致mRNA穩(wěn)定性、定位和翻譯效率的改變帜讲。

Fig 1

基于poly(A)位點(diǎn)位置的不同衅谷,APA主要分為3大類(Fig 1):

(1)編碼區(qū)域APA[CR-APA(exon)],指poly(A)位點(diǎn)位于編碼區(qū)域似将,通常涉及可變剪接获黔,會(huì)產(chǎn)生具有不同編碼序列的mRNA異構(gòu)體,因此會(huì)產(chǎn)生不同的蛋白在验;

(2)內(nèi)含子APA[IPA玷氏,CR-APA(intron)],指poly(A)位點(diǎn)位于內(nèi)含子區(qū)域腋舌,會(huì)產(chǎn)生截?cái)嗟木幋a區(qū)盏触,因此可能會(huì)翻譯缺失C端結(jié)構(gòu)域且具有新功能的蛋白

(3)3'-UTRs-APA,是最常見的APA块饺,該類APA會(huì)導(dǎo)致產(chǎn)生多種具有不同3'-UTRs長度的mRNA異構(gòu)體赞辩,但同時(shí)并不影響蛋白編碼序列。

Fig 2

文獻(xiàn)分享30中授艰,作者利用APAtrap軟件(Fig 2)來檢測APA事件辨嗽,本次推送將介紹該軟件的原理和操作。

APAtrap軟件鑒定APA的原理

Fig 3

這個(gè)軟件第一步先是檢測3‘UTR(Fig 3)想诅,其實(shí)這個(gè)信息在我們研究的物種的基因組注釋文件中是有的召庞,但是一般的基因組注釋是比較粗糙的岛心,基因結(jié)構(gòu)注釋總會(huì)存在大量的問題来破,對于一般的分析可能影響不大,但是我們現(xiàn)在研究的是APA還是有很大影響的忘古,所以這一步相當(dāng)于是對基因組注釋的校正徘禁。我們先是把基因組的注釋文件輸入進(jìn)去,它會(huì)識(shí)別出已經(jīng)注釋的3‘UTR區(qū)髓堪,然后對這個(gè)區(qū)域上下延申10kb送朱,然后從這個(gè)范圍的開頭以100bp為窗格娘荡、以1bp為步長,滑動(dòng)檢測這個(gè)范圍的reads驶沼。比如這個(gè)圖上炮沐,藍(lán)色是基因組的注釋情況,紅色是校正后的情況回怜,有可能是本來沒有注釋出3‘UTR大年,根據(jù)我們的轉(zhuǎn)錄組數(shù)據(jù)注釋到了,有可能是之前的注釋過長或者過短玉雾,最后整合這些情況得到修正好的3‘UTR翔试。

Fig 4

第二步是在這個(gè)修正后的3‘UTR,將它的最末端稱為“遠(yuǎn)端polyA位點(diǎn)”复旬,然后對3‘UTR從5’端向3’端以100bp為窗格垦缅、以1bp為步長,滑動(dòng)檢測這個(gè)范圍的reads驹碍,目的是檢測覆蓋深度顯著下降的位置壁涎,這些位置被認(rèn)定為潛在的ployA位點(diǎn)(Fig 4)。對于兩個(gè)條件的比較志秃,輸入的是多個(gè)轉(zhuǎn)錄組數(shù)據(jù)粹庞,所以對這些所有的數(shù)據(jù)在100bp以內(nèi)的polyA位點(diǎn)被合并,認(rèn)定為一個(gè)ployA位點(diǎn)洽损。需要注意這里檢測到的APA位點(diǎn)是前面介紹的三種類型中最主要的一種庞溜,即3'-UTRs-APA

Fig 5

第三步是用來檢測處理和對照是否存在差異APA的情況。

比如在給定的示意圖中(Fig 5)碑定,有A和B兩個(gè)樣本流码,在A樣本中根據(jù)深度的驟減鑒定到兩個(gè)潛在的APA位點(diǎn),它們的3‘UTR長度分別為L1和L2延刘,在sampleB中也鑒定到兩個(gè)潛在的APA漫试,它們的3‘UTR長度分別為L3和L4,就長度而言碘赖,L1<l2<l3<l4< span="">驾荣,固定這個(gè)排序,然后表征出樣本A和B在這4個(gè)APA的使用情況普泡。然后作者計(jì)算了皮爾遜相關(guān)系數(shù)播掷,該值為正表明B樣本比A樣本偏好更長的3‘UTR,為負(fù)說明A樣本偏好更長的3‘UTR撼班。

Fig 6

最后根據(jù)這兩個(gè)指標(biāo)來判定是否是差異表達(dá)的APA基因(Fig 6)歧匈。第一個(gè)是差異的百分比,作者在文章中建議的閾值是大于0.2砰嘁,第二個(gè)是校正后的P值件炉,小于0.05.

Fig 7

還有一個(gè)點(diǎn)需要注意勘究,作者針對具有長3‘UTR的基因組和具有短3‘UTR的基因組提出了不同的建議參數(shù)。針對長3‘UTR基因組舉的例子是人斟冕,用到了100bp的窗口大小和對參考基因組注釋的3‘UTR左右延申10kb的檢測范圍口糕,短3‘UTR基因組舉的例子是水稻,用50bp的窗口和左右延申5kb.

軟件實(shí)操

軟件官方鏈接:

https://sourceforge.net/p/apatrap/wiki/User%20Manual/

01 鑒定3'UTR

Fig 8

-i ?short reads mapping result in bedgraph/wig format, can accept single file or multiple files.?

-m ?gene model file in bed format.?

-o ?file store the information of extended 3'UTR in bed format.

輸入數(shù)據(jù)準(zhǔn)備:配置合適的基因組注釋文件

Fig 9

02 鑒定APA

Fig10

-i ?short reads mapping result in bedgraph/wig format, can accept single file or multiple files.?

-g ?number of groups (treatments/conditions) of the input files, e.g. -g 2.?

-n ?number of files(biological replicates) in each group (treatment/condition), e.g. -n 1 1.?

-u ?3'UTR annotation file in bed format.?

-o ?information of the predicted APA sites and their usage.

03 差異APA分析

Fig 11

輸出結(jié)果

本文使用 文章同步助手 同步

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末磕蛇,一起剝皮案震驚了整個(gè)濱河市走净,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌孤里,老刑警劉巖伏伯,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異捌袜,居然都是意外死亡说搅,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門虏等,熙熙樓的掌柜王于貴愁眉苦臉地迎上來弄唧,“玉大人,你說我怎么就攤上這事霍衫『蛞” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵敦跌,是天一觀的道長澄干。 經(jīng)常有香客問我,道長柠傍,這世上最難降的妖魔是什么麸俘? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮惧笛,結(jié)果婚禮上从媚,老公的妹妹穿的比我還像新娘。我一直安慰自己患整,他們只是感情好拜效,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著各谚,像睡著了一般紧憾。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上嘲碧,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天稻励,我揣著相機(jī)與錄音父阻,去河邊找鬼愈涩。 笑死望抽,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的履婉。 我是一名探鬼主播煤篙,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼毁腿!你這毒婦竟也來了辑奈?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤已烤,失蹤者是張志新(化名)和其女友劉穎鸠窗,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胯究,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡稍计,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了裕循。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片臣嚣。...
    茶點(diǎn)故事閱讀 37,989評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖剥哑,靈堂內(nèi)的尸體忽然破棺而出硅则,到底是詐尸還是另有隱情,我是刑警寧澤株婴,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布怎虫,位于F島的核電站,受9級(jí)特大地震影響困介,放射性物質(zhì)發(fā)生泄漏揪垄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一逻翁、第九天 我趴在偏房一處隱蔽的房頂上張望饥努。 院中可真熱鬧,春花似錦八回、人聲如沸酷愧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽溶浴。三九已至,卻和暖如春管引,著一層夾襖步出監(jiān)牢的瞬間士败,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留谅将,地道東北人漾狼。 一個(gè)月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像饥臂,于是被迫代替她去往敵國和親逊躁。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容