m6A修飾是真核RNA中最豐富的共轉錄修飾呛哟,在細胞調(diào)控中發(fā)揮著重要作用增蹭。近日掺炭,《Briefings in Bioinformatics》發(fā)表了一種基于注意力的深度學習方法adaptive-m6A筐喳,用于識別多個物種中的m6A位點岭妖。
為什么要開發(fā)adaptive-m6A?
近年來零截,深度學習方法在不同領域以及RNA修飾預測中得到了廣泛應用麸塞,但仍有一些局限性。首先涧衙,他們中的大多數(shù)只關注少數(shù)類型的物種哪工,對其他物種沒有或信息有限。其次弧哎,ML方法仍然是m6A位點預測的首選雁比,并且用于這些目的的深度學習方法通常僅限于卷積神經(jīng)網(wǎng)絡框架。此外撤嫩,這些方法對于構建經(jīng)過實驗驗證的m6A數(shù)據(jù)庫來說是耗時且勞動密集的偎捎。此外,很少有人討論不同樣本中修飾位點周圍的基序模式序攘,以顯示具有相同類型RNA轉錄后修飾的不同物種之間的潛在關系茴她。
為了克服這些障礙并研究各類物種中的m6A修飾,研究團隊開發(fā)了一個具有不同框架的多物種中m6A修飾的預測模型:adaptive-m6A程奠,是一種基于注意力的深度學習方法丈牢,由卷積神經(jīng)網(wǎng)絡、雙向長短期記憶網(wǎng)絡和注意力網(wǎng)絡機制組成瞄沙,用于識別多個物種中的m6A位點己沛。
研究內(nèi)容及性能測試
此研究種開發(fā)團隊對RNA序列中的m6A修飾進行了物種特異性預測。m6A預測方法采用SVM帕识、RF和LR等ML方法泛粹,以及主要使用由CNN、BLSTM和attention網(wǎng)絡組成的adaptive-m6A深度學習方法肮疗。
本研究中使用的預測方法的總體框架:數(shù)據(jù)收集晶姊、特征調(diào)查、模型訓練和交叉驗證以及獨立測試伪货。
Adaptive-m6A在大多數(shù)測試物種中都優(yōu)于傳統(tǒng)ML方法们衙,并取得了良好的性能;Motif分析和不同物種之間的交叉驗證表明碱呼,Adaptive-m6A可以在不同物種之間實現(xiàn)高性能蒙挑,這有助于更好地了解不同物種RNA轉錄組的序列特征和生物學機制。
由于NAC是用于探索m6A位點周圍基序的最廣泛使用的基于序列的特征愚臀,因此比較陽性和陰性數(shù)據(jù)集之間的NAC可能有助于m6A位點識別忆蚀。結果表明,在六個數(shù)據(jù)集中出現(xiàn)了修飾和未修飾的m6A序列,其中帶正電荷的核苷酸殘基(A和C)似乎在底物位點周圍具有最高頻率馋袜。
不同物種中出現(xiàn)了一些連續(xù)的基序男旗,這表明相似的模式在不同物種中往往很重要,并對相同類型的修飾有顯著貢獻欣鳖。
在大多數(shù)情況下察皇,Adaptive-m6A 模型與傳統(tǒng)的 ML 方法(SRAM 和 WHISTLE)、類似網(wǎng)絡結構的方法(即DeepPromise)相比泽台,它可以實現(xiàn)更出色的性能什荣,因為它顯示出更高的 AUC 值。與DeepOME方法相比怀酷,注意力機制提供了良好的性能稻爬,并且在涉及更大的數(shù)據(jù)規(guī)模時提供了高性能。
本研究中所涉及的所有數(shù)據(jù)均可通過如下鏈接獲纫确亍:?
https://github.com/Moretta1/Adaptive-m6A.? ??
首發(fā)公號國家基因庫大數(shù)據(jù)平臺??
參考文獻
Rulan Wang, Chia-Ru Chung, Hsien-Da Huang, Tzong-Yi Lee, Identification of species-specific RNA N6-methyladinosine modification sites from RNA sequences,?Briefings in Bioinformatics, Volume 24, Issue 2, March 2023, bbac573,?https://doi.org/10.1093/bib/bbac573