【轉(zhuǎn)錄組學(xué)】LncRNA鑒定思路與軟件比較分析

1.非編碼RNA簡介

非編碼RNA是一類被認(rèn)為不具備編碼能力RNA程梦,目前已知的已經(jīng)有十多種,主要包括了:小RNA(sRNA) <40nt斜姥、小干擾RNA惑惶、miRNA(18-24nt)、長非編碼lncRNA(>200nt)凄吏、核糖體RNA远舅、核小RNA、核仁小RNA等等痕钢。隨著人們認(rèn)知的逐漸深入图柏,發(fā)現(xiàn)這些非編碼RNA在轉(zhuǎn)錄調(diào)控上發(fā)揮著重要的作用,并且其他部分同樣具有編碼蛋白的功能任连。

1.1 lncRNA結(jié)構(gòu)

在非編碼RNA中蚤吹,有一類長度超過200 nt的RNA分子,被稱為長鏈非編碼RNA随抠。非編碼RNA的來源包括基因間轉(zhuǎn)錄本裁着、增強子RNA、正義/反義轉(zhuǎn)錄本等拱她。研究發(fā)現(xiàn)一些lncRNA與mRNA非常相似二驰,同樣具有5'帽子結(jié)構(gòu)和polyA尾巴,區(qū)別是不具有開放讀碼框(open reading frame, ORF)秉沼。在lncRNA的形成過程中桶雀,lncRNA的轉(zhuǎn)錄由RNA聚合酶II/III所引導(dǎo),并且大多數(shù)lncRNA和mRNA一樣具有polyA尾巴氧猬。然而背犯,某些lncRNA有著不同的加工修飾途徑,其加工過程與tRNA形成過程較為相似盅抚,其初始轉(zhuǎn)錄本的3'端同樣會經(jīng)過RNase P的切割漠魏,形成一段類似于tRNA的mascRNA (MALAT1-associated small cytoplasmic RNA)。

1.2 lncRNA功能與特征

lncRNA最重要的生物學(xué)功能之一就是可以與特定蛋白相結(jié)合妄均,進(jìn)而發(fā)揮相應(yīng)的作用柱锹。有些支架蛋白或RBP在與作為骨架的lncRNA結(jié)合后哪自,促使大分子復(fù)合物的形成和激活,能夠進(jìn)一步激活下游通路或直接發(fā)揮作用禁熏。一部分lncRNA可通過與蛋白結(jié)合順式地作用于某些基因的轉(zhuǎn)錄起始位點壤巷,進(jìn)而調(diào)節(jié)基因轉(zhuǎn)錄。lncRNA也可以直接與DNA序列結(jié)合瞧毙,從而形成RNA-DNA三股螺旋復(fù)合物胧华,使得染色質(zhì)構(gòu)象處于開放狀態(tài),促進(jìn)基因的轉(zhuǎn)錄宙彪。其他lncRNA則具有輔助抑制因子的功能矩动,可與特定轉(zhuǎn)錄因子結(jié)合,阻礙其與DNA的結(jié)合释漆,而抑制RNA聚合酶的活性悲没。此外,lncRNA在染色質(zhì)結(jié)構(gòu)重建和三維結(jié)構(gòu)中也起著重要作用男图,可通過與染色質(zhì)修飾復(fù)合物或增強子元件結(jié)合示姿,促進(jìn)激活子活性。此外逊笆,反義lncRNA與相重疊的蛋白編碼基因可以相互抑制其基因的表達(dá)栈戳。近年來,有研究表明lncRNA也是一種重要的內(nèi)源性競爭抑制ncRNA,可作為miRNA的抑制因子览露,調(diào)節(jié)其miRNA對靶基因的負(fù)向調(diào)控作用荧琼。到目前為止,已經(jīng)有大量的lncRNA-miRNA-mRNA作用通路被揭示并研究了其在各種疾病或者發(fā)育進(jìn)程中的作用差牛。盡管大多數(shù)lncRNA不具有編碼能力,仍然有研究或預(yù)測分析發(fā)現(xiàn)有少部分lncRNA具有編碼能力堰乔,可以翻譯形成小分子量的蛋白質(zhì)偏化。

2. lncRNA鑒定

lncRNA預(yù)測軟件主要有2種方法,一種是直接預(yù)測其是否含有ORF元件或同源預(yù)測的方法;另一種是基于機器學(xué)習(xí)的方法,常見的方法包括:線性回歸算法镐侯、支持向量機(SVM)侦讨、或者隨機森林、深度學(xué)習(xí)等苟翻。目前主流的方法是采用機器學(xué)習(xí)算法鑒定lncRNA韵卤。

2.1 機器學(xué)習(xí)鑒定lncRNA

從是否有參考來看可以分為有參類和無參類。

2.1.1 有參考的鑒定策略

CPC是典型的有參類鑒定軟件崇猫,它基于SVM算法設(shè)計沈条,被廣泛使用在lncRNA的鑒定上,是目前公司的主要鑒定方法诅炉。然而CPC預(yù)測lncRNA并沒有想象中的這么美好蜡歹。首先屋厘,CPC 本身就不為 lncRNA 鑒定而設(shè)計的,它可以根據(jù) BLASTX 的開放閱讀框信息和比對結(jié)果預(yù)測lncRNA 月而,lncRNA不如mRNA 保守汗洒,高比例的 lncRNA 表現(xiàn)出許多類似于蛋白質(zhì)編碼序列的特征 。這會使流程錯誤地將lncRNA 歸類為mRNA父款。其次溢谤,CPC 需要一個高質(zhì)量且相當(dāng)全面的數(shù)據(jù)庫,但許多物種的注釋信息并不完整憨攒,甚至缺少有效的參考基因組溯香。其次,CPC 嚴(yán)重依賴 BLASTX 的輸出浓恶,但多序列比對工具不能保證最佳比對玫坛。最后,極其耗時的比對過程使得在海量數(shù)據(jù)上使用CPC耗時耗力包晰,需要高昂的運算條件和資源湿镀。

2.1.2 無參考的鑒定策略

基于CPC的尷尬使用范圍,和不算優(yōu)秀的可靠性伐憾,人們又開發(fā)了一系列無參類軟件勉痴,如CPC2, CNCI, lncRNA MFDL, lncScore, LncADeep, DeepLNC, LncRNAnet, COME, CPAT, lncRScan-SVM, longdist, PLEK, FEElnc, 和LncFinder等。
就LncFinder的作者對同類的深度學(xué)習(xí)軟件進(jìn)行對比树肃,結(jié)果如下圖所示:


image.png

LncFinder在各類數(shù)據(jù)集中基本都有最佳的表現(xiàn)蒸矛。對于人類和小鼠數(shù)據(jù)集,CPC 的特異性最高胸嘴,但敏感性最低雏掠,這種不平衡性使得它的綜合性能較差。CPC2 僅使用序列內(nèi)在特征預(yù)測 lncRNA劣像,且在人類數(shù)據(jù)集上的表現(xiàn)比CPC好很多乡话;但是,CPC2 在小鼠數(shù)據(jù)集上的性能略低于 CPC耳奕。對于其他無需對齊的識別工具绑青,CPAT 的準(zhǔn)確率高于 CPC、CNCI 和 PLEK屋群,但低于 LncFinder闸婴。即使排除了二級結(jié)構(gòu)衍生特征,LncFinder 在人類和小鼠數(shù)據(jù)集上也取得了最佳性能芍躏。加之LncFinder是一個R包可以在各個平臺上進(jìn)行使用邪乍,速度也相當(dāng)?shù)目欤皇橐环N新lncRNA-seq流程的鑒定工具。

下一期我們將帶來LncFinder包的生信實戰(zhàn)
最后:如果想了解更多和生信或者精品咖啡有關(guān)的內(nèi)容歡迎關(guān)注我的微信公眾號:生信咖啡溺欧,更多精彩等你發(fā)現(xiàn)喊熟!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市姐刁,隨后出現(xiàn)的幾起案子芥牌,更是在濱河造成了極大的恐慌,老刑警劉巖聂使,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件壁拉,死亡現(xiàn)場離奇詭異,居然都是意外死亡柏靶,警方通過查閱死者的電腦和手機弃理,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來屎蜓,“玉大人痘昌,你說我怎么就攤上這事【孀” “怎么了辆苔?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長扼劈。 經(jīng)常有香客問我驻啤,道長,這世上最難降的妖魔是什么荐吵? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任骑冗,我火速辦了婚禮,結(jié)果婚禮上先煎,老公的妹妹穿的比我還像新娘贼涩。我一直安慰自己,他們只是感情好榨婆,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布磁携。 她就那樣靜靜地躺著,像睡著了一般良风。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上闷供,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天烟央,我揣著相機與錄音,去河邊找鬼歪脏。 笑死疑俭,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的婿失。 我是一名探鬼主播钞艇,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼啄寡,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了哩照?” 一聲冷哼從身側(cè)響起挺物,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎飘弧,沒想到半個月后识藤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡次伶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年痴昧,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片冠王。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡赶撰,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出柱彻,到底是詐尸還是另有隱情豪娜,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布绒疗,位于F島的核電站侵歇,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏吓蘑。R本人自食惡果不足惜惕虑,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望磨镶。 院中可真熱鬧溃蔫,春花似錦、人聲如沸琳猫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽脐嫂。三九已至统刮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間账千,已是汗流浹背侥蒙。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留匀奏,地道東北人鞭衩。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親论衍。 傳聞我的和親對象是個殘疾皇子瑞佩,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容