【circRNA】circRNA的鑒定

通過(guò)spliced reads的mapping能發(fā)現(xiàn)線性RNA和環(huán)狀RNA的剪切方式不同蔽豺。一個(gè)是正常的5’/3’前后剪切撬槽,一個(gè)是反向的5’/3’反向剪切(Memczak et al.2013.Nature)。

====建庫(kù)策略====

環(huán)狀RNA 測(cè)序數(shù)據(jù)量

  • 如果使用環(huán)狀RNA 建庫(kù)的策略恤煞,建議測(cè)序量不低于6G/樣本(植物)

  • 如果采用普通lncRNA 文庫(kù)屎勘,建議植物的測(cè)序量不低于12G/樣本,動(dòng)物則推薦16G/樣本以上的測(cè)序量居扒。

建庫(kù)策略的選擇

  • 如果是環(huán)狀RNA 未報(bào)導(dǎo)的物種概漱,建議優(yōu)先采用環(huán)狀RNA 建庫(kù)的策略,以便對(duì)環(huán)狀RNA有更好的檢測(cè)效率喜喂,發(fā)現(xiàn)盡可能多的環(huán)狀RNA瓤摧。

  • 如果是環(huán)狀RNA 已報(bào)導(dǎo),且認(rèn)為目標(biāo)環(huán)狀RNA有較高的豐度玉吁,同時(shí)又特別關(guān)心環(huán)狀RNA 與其他線性RNA 的相互作用關(guān)系照弥,則可以考慮使用普通lncRNA 文庫(kù)的策略。

所以进副,我們實(shí)驗(yàn)的方案都是采用環(huán)狀RNA建庫(kù)的这揣。

====鑒定方法========

CircRNA檢測(cè)的基本原理是去識(shí)別反向剪切的位點(diǎn)(back-splice),最主要的circRNA類(lèi)型是外顯子來(lái)源的影斑,當(dāng)然给赞,在內(nèi)含子、間區(qū)矫户、UTR區(qū)域片迅、lncRNA區(qū)域以及已知轉(zhuǎn)錄本的反義鏈區(qū)域也都鑒定到circRNA,同一個(gè)位點(diǎn)可能形成多個(gè)circRNA皆辽,每個(gè)circRNA可能包含一個(gè)或多個(gè)外顯子柑蛇。CircRNA的數(shù)量從幾千到幾萬(wàn)都有可能芥挣。要研究circRNA,鑒定是第一步耻台,也是最重要的一步空免,目前已經(jīng)有一些pipeline,鑒定得到的circRNA是否準(zhǔn)確和全面粘我,取決于算法的嚴(yán)謹(jǐn)性和可靠性鼓蜒。

?

根據(jù)已發(fā)表的文獻(xiàn),環(huán)狀RNA的鑒定方法分為三類(lèi):

?

1. 從頭預(yù)測(cè)(abinitio)的方法:find_circ(如下圖)(Memczaketal., 2013)征字,將不能和基因組比對(duì)上讀段的兩端各取20bp作為錨點(diǎn)都弹,再將錨點(diǎn)作為獨(dú)立的讀段往基因組上比對(duì)并尋找唯一匹配位點(diǎn),如果兩個(gè)錨點(diǎn)的比對(duì)位置在線性上方向呈反向匙姜,那么就延長(zhǎng)錨點(diǎn)的讀段畅厢,直至找到環(huán)狀RNA的接合位置(junction),若此時(shí)兩側(cè)的序列分別為GT/AG剪接信號(hào)氮昧,則判斷為潛在的環(huán)狀RNA框杜。

2. 基于RNA-seq比對(duì)工具如:Tophat-fusion(KimandSalzberg, 2011)、Mapsplice(Wanget al., 2010)袖肥、STAR(Dobinet al., 2013)咪辱、segemehl(Hoffmannet al., 2014)等,以尋找融合基因的思想檢測(cè)環(huán)狀RNA(如下圖):先將不能比對(duì)到轉(zhuǎn)錄本上的讀段提取出來(lái)椎组,再根據(jù)軟件預(yù)測(cè)結(jié)果找出處于同一條染色體上的融合基因油狂,最后根據(jù)基因組注釋文件中外顯子的邊界來(lái)判斷是否為環(huán)狀RNA。(這也是目前最常用的方法)

3. 專(zhuān)門(mén)為尋找環(huán)狀RNA而設(shè)計(jì)的算法和工具(如下圖)如CIRI寸癌,它考慮了經(jīng)典的環(huán)狀RNA以及一些短外顯子成環(huán)狀RNA的情況专筷,同樣以GT-AG剪接信號(hào)和外顯子邊界得到環(huán)狀RNA。

===鑒定方法比較====

2015蒸苇,NAR發(fā)表了來(lái)自于丹麥奧爾胡斯大學(xué)(Aarhus University)的研究人員(Comparison of circular RNA prediction tools)利用普通的RNA-Seq數(shù)據(jù)比較了5種常用的環(huán)狀RNA預(yù)測(cè)軟件(見(jiàn)表1)磷蛹。

這些算法都依賴外部比對(duì)工具,CIRCexplorer和Mapsplice需要有注釋信息溪烤,其他三種可以不依賴注釋信息味咳,但是準(zhǔn)確性會(huì)有所下降。耗用資源方面檬嘀,僅finc_circ可以用單機(jī)運(yùn)算(8G RAM)莺葫,CIRI耗用資源最多。

測(cè)試數(shù)據(jù):

物種:人

數(shù)據(jù):SRR444655和SRR444975枪眉,未用RNaseR處理,該文章中主要用于分析的數(shù)據(jù)再层;

SRR444974和SRR445016贸铜,使用RNaseR處理堡纬,用于驗(yàn)證預(yù)測(cè)方法預(yù)測(cè)得到的circRNA準(zhǔn)確性的數(shù)據(jù)。

測(cè)序儀器:Hiseq2000蒿秦,pair-end烤镐。

測(cè)序量:31.4-41.3GB/樣本。

預(yù)測(cè)結(jié)果比較

首先棍鳖,研究人員用5個(gè)軟件分別對(duì)同一個(gè)rRNA-depleted RNA-Seq數(shù)據(jù)集進(jìn)行分析炮叶。他們發(fā)現(xiàn)各個(gè)算法給出的環(huán)狀RNA數(shù)目從1500(circRNA_finder)到4000(CIRI)不等,并且只有854個(gè)同時(shí)被5個(gè)軟件發(fā)現(xiàn)(如下圖所示)渡处。

為了驗(yàn)證軟件給出的circRNA是否可信镜悉,研究人員試圖引入線性RNA酶消化(RNase R)的RNA-Seq數(shù)據(jù)來(lái)判斷預(yù)測(cè)到的circRNA是否存在假陽(yáng)性。

結(jié)果顯示不同的軟件給出的circRNA對(duì)RNase R的抵制效率不同医瘫,其中侣肄,CIRI表現(xiàn)最差,有28.03%的假陽(yáng)性率(見(jiàn)下圖)醇份。

研究人員還關(guān)心每個(gè)軟件預(yù)測(cè)出的表達(dá)量最高的100個(gè)circRNA是否真的是環(huán)狀稼锅。他們分別以junction read數(shù)目對(duì)環(huán)狀RNA進(jìn)行排序,觀察表達(dá)量高的前100個(gè)環(huán)狀RNA是否被線性RNA酶消化僚纷。

同樣矩距,在CIRI的預(yù)測(cè)中高表達(dá)的環(huán)狀RNA有超過(guò)半數(shù)(63%)不可靠。MapSplice和CIRCexplorer是表現(xiàn)最好的兩款軟件怖竭,分別只有9%和6%的circRNA被消化(圖下圖)锥债。

通過(guò)比較現(xiàn)有的circRNA預(yù)測(cè)軟件,我們可以看到不同的算法表現(xiàn)差異較大侵状,用戶在使用的時(shí)候需要小心赞弥。(從venn圖也可以看出其實(shí)overlap的概率是不高的)

CIRCexplorer和MapSplice輸出最可信的circRNA列表,主要的原因是這兩個(gè)算法依靠已知的基因注釋文件趣兄,明確的序列注釋信息可以幫助他們降低假陽(yáng)性率绽左,但也限制了這兩個(gè)軟件不能發(fā)現(xiàn)de novo的環(huán)狀RNA。

CircRNA_finder和find_circ也有著很高的準(zhǔn)確性艇潭,并且這兩個(gè)軟件可以獨(dú)立于基因注釋信息運(yùn)行拼窥,預(yù)測(cè)全新的環(huán)狀RNA。

由于單個(gè)軟件往往在一個(gè)方面存在著一定的局限性蹋凝,且數(shù)據(jù)表明能夠被多個(gè)算法預(yù)測(cè)到的環(huán)狀RNA有著較高的可信度鲁纠,因此,在實(shí)際項(xiàng)目中鳍寂,推薦大家多使用兩到三個(gè)環(huán)狀RNA預(yù)測(cè)軟件改含,進(jìn)而取它們的交集。

對(duì)于任意兩種方法檢測(cè)的效果迄汛,文中也做了比較:

從圖中我們可以看到捍壤,兩種方法聯(lián)用可以降低假陽(yáng)性骤视,提高準(zhǔn)確率。

本文使用 文章同步助手 同步

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末鹃觉,一起剝皮案震驚了整個(gè)濱河市专酗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌盗扇,老刑警劉巖祷肯,帶你破解...
    沈念sama閱讀 221,576評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異疗隶,居然都是意外死亡佑笋,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)抽减,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)允青,“玉大人,你說(shuō)我怎么就攤上這事卵沉〉唢保” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,017評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵史汗,是天一觀的道長(zhǎng)琼掠。 經(jīng)常有香客問(wèn)我,道長(zhǎng)停撞,這世上最難降的妖魔是什么瓷蛙? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,626評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮戈毒,結(jié)果婚禮上艰猬,老公的妹妹穿的比我還像新娘。我一直安慰自己埋市,他們只是感情好冠桃,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著道宅,像睡著了一般食听。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上污茵,一...
    開(kāi)封第一講書(shū)人閱讀 52,255評(píng)論 1 308
  • 那天樱报,我揣著相機(jī)與錄音,去河邊找鬼泞当。 笑死迹蛤,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播笤受,決...
    沈念sama閱讀 40,825評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼穷缤,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了箩兽?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,729評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤章喉,失蹤者是張志新(化名)和其女友劉穎汗贫,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體秸脱,經(jīng)...
    沈念sama閱讀 46,271評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡落包,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了摊唇。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咐蝇。...
    茶點(diǎn)故事閱讀 40,498評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖巷查,靈堂內(nèi)的尸體忽然破棺而出有序,到底是詐尸還是另有隱情,我是刑警寧澤岛请,帶...
    沈念sama閱讀 36,183評(píng)論 5 350
  • 正文 年R本政府宣布旭寿,位于F島的核電站,受9級(jí)特大地震影響崇败,放射性物質(zhì)發(fā)生泄漏盅称。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評(píng)論 3 333
  • 文/蒙蒙 一后室、第九天 我趴在偏房一處隱蔽的房頂上張望缩膝。 院中可真熱鬧,春花似錦岸霹、人聲如沸疾层。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,338評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)云芦。三九已至,卻和暖如春贸桶,著一層夾襖步出監(jiān)牢的瞬間舅逸,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,458評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工皇筛, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留琉历,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,906評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像旗笔,于是被迫代替她去往敵國(guó)和親彪置。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容