"牛津納米孔技術(shù)公司(Oxford Nanopore Technologies,ONT)開發(fā)的第三代測(cè)序平臺(tái)是 目前唯一能夠直接對(duì)天然RNA鏈進(jìn)行測(cè)序的技術(shù)平臺(tái)姚建。ONT - Direct RNA Sequecing (DRS呐舔,直接RNA測(cè)序)技術(shù)能夠?qū)μ烊蝗L(zhǎng)RNA鏈進(jìn)行測(cè)序币励,同時(shí)能夠保留并檢測(cè)RNA堿基的修飾信息,并能夠相對(duì)準(zhǔn)確地估算 poly(A) 尾的長(zhǎng)度珊拼,從而還原RNA的真實(shí)特征食呻。"
在過(guò)去的十年中,RNA測(cè)序(
RNA-seq
)逐漸成為了全轉(zhuǎn)錄組水平分析差異基因表達(dá)和研究mRNA差異剪接的不可或缺的工具澎现。隨著第二代高通量測(cè)序技術(shù)(也稱Next-Generation Sequencing仅胞,NGS)的發(fā)展和成本的降低,RNA-seq的應(yīng)用領(lǐng)域也在不斷擴(kuò)大〗1瑁現(xiàn)在干旧,RNA-seq已經(jīng)能夠應(yīng)用于很多RNA層面的研究,包括單細(xì)胞基因表達(dá)(single cell
)妹蔽、RNA翻譯組(translatome
)和 RNA結(jié)構(gòu)組(structurome
)等椎眯。近幾年興起的(令人激動(dòng)的)新應(yīng)用也將RNA-seq帶入了三維空間,如空間轉(zhuǎn)錄組學(xué)(spatialomics
)胳岂。
通過(guò)結(jié)合日益成熟的第三代長(zhǎng)讀長(zhǎng)測(cè)序(long-read)和 直接RNA測(cè)序(Direct RNA-seq)技術(shù)(圖1)编整,以及更先進(jìn)的計(jì)算分析工具,RNA-seq將幫助科研人員對(duì)RNA生物學(xué)有更全面旦万、更精細(xì)的理解: 從轉(zhuǎn)錄本在何時(shí)何地轉(zhuǎn)錄到RNA折疊以及分子互作發(fā)揮功能等1,2闹击。
近年來(lái)和敬,隨著二代測(cè)序技術(shù)的發(fā)展国葬,傳統(tǒng)的轉(zhuǎn)錄組測(cè)序(RNA-seq)已經(jīng)成為研究基因表達(dá)調(diào)控的主要技術(shù)手段。很多物種的基因調(diào)控非常多樣和復(fù)雜蔽挠,絕大多數(shù)真核生物基因不符合“一基因一轉(zhuǎn)錄本”的模式淆两,這些基因往往存在多種剪切形式断箫。通過(guò)二代測(cè)序,可以很準(zhǔn)確地進(jìn)行基因的表達(dá)及定量的研究秋冰,但是由于測(cè)序讀長(zhǎng)的限制仲义,不能精確的得到全長(zhǎng)轉(zhuǎn)錄本的信息,以至于無(wú)法深入到轉(zhuǎn)錄本水平進(jìn)行研究(圖1)剑勾。因此埃撵,基于三代長(zhǎng)讀長(zhǎng)測(cè)序平臺(tái)的全長(zhǎng)轉(zhuǎn)錄組成為新的研究熱潮。
全長(zhǎng)轉(zhuǎn)錄組(Full-length transcriptome)是基于 PacBio(Pacific Biosciences) 或 ONT(Oxford Nanopore Technologies) 三代測(cè)序平臺(tái)虽另,富集mRNA后無(wú)需打斷拼接暂刘,直接獲得包含5’UTR、3’UTR捂刺、polyA尾的mRNA全長(zhǎng)序列及完整結(jié)構(gòu)信息谣拣,從而準(zhǔn)確分析有參考基因組物種可變剪接及融合基因等結(jié)構(gòu)信息募寨,克服無(wú)參考基因組物種轉(zhuǎn)錄本拼接較短、信息不完整的難題(圖2)森缠。
在全長(zhǎng)轉(zhuǎn)錄組基礎(chǔ)之上,ONT-三代測(cè)序平臺(tái)的直接RNA測(cè)序(Direct RNA-seq)贵涵,相對(duì)于傳統(tǒng)的 反轉(zhuǎn)錄cDNA - PCR擴(kuò)增(二代和三代RNA-seq測(cè)序都有相應(yīng)的建庫(kù)方案)流程列肢,其能夠保留并檢測(cè)天然RNA堿基修飾信息,還原真實(shí)RNA特征独悴,也省去了傳統(tǒng) RNA m6A甲基化修飾繁瑣的實(shí)驗(yàn)檢測(cè)步驟例书, 如 MeRIP-seq/m6A-seq和m6A-SEAL-seq等 锣尉。
一刻炒、RNA(mRNA)測(cè)序技術(shù)發(fā)展
超過(guò)95%的已發(fā)表的RNA-seq數(shù)據(jù)(Short Read Archive,SRA數(shù)據(jù)庫(kù))都是由以Illumina平臺(tái)為代表的短讀長(zhǎng)(short-read)第二代測(cè)序技術(shù)平臺(tái)生成的1自沧。由于短讀長(zhǎng)cDNA測(cè)序方案的幾乎涵蓋了所有公開可用的mRNA-seq數(shù)據(jù)坟奥,這個(gè)技術(shù)作為RNA-seq的基準(zhǔn),這一部分也主要圍繞mRNA的測(cè)序?yàn)橹饕獌?nèi)容拇厢。長(zhǎng)讀長(zhǎng)cDNA測(cè)序和最近的直接RNA測(cè)序方法將很快對(duì)二代測(cè)序平臺(tái)主導(dǎo)地位構(gòu)成挑戰(zhàn)爱谁,因?yàn)閷で竽軌蛱岣咿D(zhuǎn)錄本/異構(gòu)體水平上的分辨率和想要獲得RNA堿基修飾的需求在不斷涌現(xiàn)。
1. 短讀長(zhǎng)(short-read)cDNA測(cè)序
短讀長(zhǎng)(short-read)二代測(cè)序是轉(zhuǎn)錄組范圍基因檢測(cè)和表達(dá)定量最常見方式孝偎,其主要原因是它可以獲得全面的访敌,高質(zhì)量的全轉(zhuǎn)錄組表達(dá)數(shù)據(jù)∫露埽基于Illumina測(cè)序平臺(tái)的轉(zhuǎn)錄組表達(dá)測(cè)序?qū)嶒?yàn)(RNA-seq)和分析包含以下核心步驟(以真核mRNA為例):RNA的提取寺旺,mRNA的富集、cDNA的合成势决,接頭連接阻塑,PCR擴(kuò)增,上機(jī)測(cè)序和后期的數(shù)據(jù)分析(圖3)果复。
由于二代測(cè)序讀長(zhǎng)限制陈莽,需要mRNA片段化和文庫(kù)純化時(shí)磁珠篩選300-500bp的片段,所以最后獲得的cDNA片段都在300-500bp左右(雙端150bp和雙端250bp建庫(kù))虽抄。對(duì)于常規(guī)有參基因表達(dá)定量走搁,每個(gè)樣本平均測(cè)到2000萬(wàn)到3000萬(wàn)條序列 (20-30 milion reads)就已經(jīng)足夠了,等同于雙端150bp (PE150)測(cè)序大約需要6G-9G (Gbase迈窟,Gb堿基數(shù))的數(shù)據(jù)量私植;例如,150bp X 2端 X 20M reads = 6000 M = 6G菠隆,這里的6G數(shù)據(jù)量跟你看到的fastq.gz
或者fastq
文件大斜铡(gigabyte狂秘,GB)還不是一回事,實(shí)際文件大小和壓縮比率還有關(guān)系躯肌;拿到原始序列的fastq.gz
數(shù)據(jù)后者春,就可以對(duì)每個(gè)基因或轉(zhuǎn)錄本進(jìn)行表達(dá)定量,最后再用統(tǒng)計(jì)學(xué)方法計(jì)算統(tǒng)計(jì)組間差異表達(dá)的基因清女。
短讀長(zhǎng)二代測(cè)序RNA-seq結(jié)果容錯(cuò)率相對(duì)較高(robust)钱烟,對(duì)其多次測(cè)試比較發(fā)現(xiàn),其平臺(tái)內(nèi)和平臺(tái)間的相關(guān)性都很好嫡丙。然而在樣本準(zhǔn)備和計(jì)算分析階段的某些步驟中也會(huì)引入誤差和缺陷拴袭,這些局限性會(huì)影響特定生物問(wèn)題的解釋,比如正確地識(shí)別和定量一個(gè)基因的多個(gè)轉(zhuǎn)錄異構(gòu)體(isoform)曙博,尤其對(duì)于轉(zhuǎn)錄本較長(zhǎng)或者多變的生物拥刻,如人的轉(zhuǎn)錄組中,50%的轉(zhuǎn)錄本長(zhǎng)度大于2500 bp父泳,轉(zhuǎn)錄本長(zhǎng)度范圍在186 bp~109 kb之間般哼。從根本上解決短讀長(zhǎng)-cDNA測(cè)序固有局限性的最有效的方法還是通過(guò)長(zhǎng)度長(zhǎng)cDNA測(cè)序和直接RNA測(cè)序的方法。
2. 長(zhǎng)度長(zhǎng)(long-read)cDNA 測(cè)序
盡管以Illumina為代表的短讀長(zhǎng)(short-read)二代測(cè)序是目前主流的RNA-seq平臺(tái)蒸眠,但 PacBio 和 ONT 三代測(cè)序平臺(tái)能對(duì)反轉(zhuǎn)錄為cDNA后的全長(zhǎng)mRNA進(jìn)行單分子實(shí)時(shí)測(cè)序。因?yàn)闆]有短序列的拼接組裝步驟杆融,進(jìn)而克服了短讀長(zhǎng)二代測(cè)序的一些問(wèn)題 -- 例如序列比對(duì)的不確定性楞卡,無(wú)法直接還原較長(zhǎng)的轉(zhuǎn)錄本的原貌 -- 有助于更好地捕捉轉(zhuǎn)錄異構(gòu)體(isoform)的多樣性。
PacBio Iso-Seq脾歇, 基于PacBio三代測(cè)序平臺(tái)的mRNA Iso-Seq建庫(kù)測(cè)序流程能夠檢測(cè)長(zhǎng)達(dá)15 kb的全長(zhǎng)轉(zhuǎn)錄本序列蒋腮,有助于發(fā)現(xiàn)大量先前未注釋到的轉(zhuǎn)錄本,并可通過(guò)全長(zhǎng)序列確認(rèn)早期基于跨物種同源序列的基因預(yù)測(cè)結(jié)果介劫。在標(biāo)準(zhǔn)的Iso-Seq實(shí)驗(yàn)中徽惋,模板置換(template-switching)逆轉(zhuǎn)錄酶可以將高質(zhì)量mRNA轉(zhuǎn)化為用來(lái)測(cè)序的全長(zhǎng)cDNA,然后將得到的cDNA進(jìn)行PCR擴(kuò)增座韵,并構(gòu)建PacBio SMRT(單分子實(shí)時(shí) single-molecule, real-time险绘,SMRT)測(cè)序文庫(kù)。同時(shí)PacBio測(cè)序?qū)δ0辶啃枨蠛艽笥辏筮M(jìn)行大體積PCR宦棺,需要優(yōu)化反應(yīng)體系降低過(guò)度擴(kuò)增的影響。PCR末端修復(fù)和PacBio SMRT啞鈴狀測(cè)序接頭連接后黔帕,就可以上機(jī)測(cè)序了 (圖4)代咸。一張SMRT cell 8M芯片能產(chǎn)生大約 4-5M 的序列(reads)。
ONT cDNA-PCR呐芥,基于ONT三代測(cè)序平臺(tái)的cDNA-PCR建庫(kù)測(cè)序流程也可以檢測(cè)全長(zhǎng)轉(zhuǎn)錄本逻杖,而且適用于單細(xì)胞全長(zhǎng)轉(zhuǎn)錄組測(cè)序。同樣使用模板置換反轉(zhuǎn)錄思瘟,PCR擴(kuò)增來(lái)制備全長(zhǎng)轉(zhuǎn)錄本文庫(kù)(圖5)荸百。在加接頭制備測(cè)序文庫(kù)之前,可以自己決定是否進(jìn)行PCR擴(kuò)增滨攻,又可細(xì)分為PCR-cDNA和直接cDNA(雙鏈)測(cè)序够话。PCR擴(kuò)增的cDNA文庫(kù)的測(cè)序產(chǎn)出(測(cè)序獲得的reads數(shù))更高,適用于樣本中RNA含量較少的情況光绕。一般來(lái)說(shuō) 6G(Gbase女嘲,Gb堿基數(shù))數(shù)據(jù)量大約能獲得4-5百萬(wàn)(million,M)條序列(reads)诞帐。
3. 長(zhǎng)度長(zhǎng)(long-read)直接RNA測(cè)序
2018年初,ONT-Direct RNA Sequencing技術(shù)登上了Nature Method的封面(圖1)景埃。直到這兩年媒至,此項(xiàng)技術(shù)整體趨向成熟,包括堿基準(zhǔn)確度的提升谷徙,價(jià)格的下降和修飾信號(hào)識(shí)別算法的提升。直接RNA測(cè)序建庫(kù)過(guò)程中沒有第二cDNA鏈的合成驯绎、PCR擴(kuò)增這些過(guò)程完慧,不僅避免了這些操作帶來(lái)的偏好性和錯(cuò)誤, 并且保留了RNA上的表觀修飾信息剩失。
首先屈尼,帶有oligo(dT)末端的引物與mRNA的PolyA尾巴退火連接;后續(xù)是一個(gè)可選的反轉(zhuǎn)錄操作拴孤,用于提高測(cè)序通量和RNA單鏈的穩(wěn)定性(一般推薦做)脾歧;最后添加連有分子馬達(dá)的測(cè)序接頭用于后續(xù)測(cè)序。文庫(kù)加載入MinION或PromethION芯片即可啟動(dòng)3?poly(A)尾巴向5?cap端的mRNA直接測(cè)序演熟。雖然直接RNA測(cè)序的價(jià)格相比于傳統(tǒng)RNA-seq高出不少且不支持混樣鞭执,但是其能直接檢測(cè)RNA堿基修飾的潛力有望在表觀轉(zhuǎn)錄組領(lǐng)域促進(jìn)更新的發(fā)現(xiàn)。
二兄纺、需要反轉(zhuǎn)錄和PCR擴(kuò)增的RNAseq測(cè)序
對(duì)于二代測(cè)序平臺(tái)(Illumina & 華大DNBSEQ),傳統(tǒng)的RNA測(cè)序(如RNA-seq)化漆,無(wú)論是用 oligo(dT)引物 將 mRNA(真核生物)反轉(zhuǎn)錄 至 cDNA(complementary DNA估脆,cDNA),再進(jìn)行 cDNA 的片段化 (圖7)座云;還是先將 mRNA 打斷疙赠,再結(jié)合六堿基隨機(jī)引物(Random Hexamers)反轉(zhuǎn)錄合成第一條 cDNA鏈隨后合成第二條cDNA鏈(圖7)付材, mRNA 都需要 反轉(zhuǎn)錄 成 cDNA,經(jīng)過(guò)PCR擴(kuò)增再進(jìn)行測(cè)序圃阳。
對(duì)于三代測(cè)序平臺(tái)(PacBio & ONT)伞租,Iso-seq全長(zhǎng)RNA測(cè)序試劑盒(Iso-Seq library preparation using SMRTbell prep kit 3.0,PacBio)和 cDNA-PCR測(cè)序試劑盒(cDNA-PCR Sequencing Kit V14限佩,ONT)的原理基本類似葵诈,先用oligo(dT)引物反轉(zhuǎn)錄成全長(zhǎng)mRNA-cDNA,再通過(guò)模板轉(zhuǎn)換引物(Template Switching Oligos 祟同,TSO)作喘,加入5'端PCR擴(kuò)增引物,最后通過(guò)PCR對(duì)全長(zhǎng)轉(zhuǎn)錄組進(jìn)行擴(kuò)增晕城,然后建庫(kù)測(cè)序 (圖8泞坦,圖9)。
由于測(cè)序平臺(tái)原理的限制(Illumia的邊合成邊測(cè)序和PacBio依賴DNA聚合酶的單分子實(shí)時(shí)測(cè)序都需要DNA雙鏈)砖顷,RNA測(cè)序都要通過(guò)RT-PCR構(gòu)建cDNA文庫(kù)贰锁,這個(gè)流程不僅過(guò)程繁瑣,還可能引入偏差和錯(cuò)誤(如PCR擴(kuò)增)滤蝠,從而影響最終結(jié)果的準(zhǔn)確性豌熄。此外,這些平臺(tái)技術(shù)都無(wú)法用于堿基修飾物咳、mRNA的5'-甲基鳥苷帽以及3'-腺苷尾的研究锣险。
三、ONT - 直接RNA測(cè)序(Direct RNA-seq览闰,DRS)
正如上面展示的芯肤,經(jīng)典的RNA測(cè)序流程,通常需要將RNA先反轉(zhuǎn)錄為cDNA压鉴,經(jīng)過(guò)PCR擴(kuò)增后再進(jìn)行建庫(kù)測(cè)序崖咨。而直接RNA測(cè)序技術(shù)(Direct RNA Sequencing,簡(jiǎn)稱DRS)只需將mRNA單鏈反轉(zhuǎn)錄為RNA - cDNA雙鏈后就能直接對(duì)其測(cè)序油吭,整個(gè)過(guò)程無(wú) RNA/cDNA 雙鏈轉(zhuǎn)DNA雙鏈和PCR擴(kuò)增過(guò)程击蹲,直接獲得mRNA的序列及其堿基修飾信息 (圖6)。
由于牛津納米孔科技(Oxford Nanopore Technologies上鞠,ONT)三代測(cè)序平臺(tái)的技術(shù)原理 ---- RNA/cDNA雙鏈能直接在馬達(dá)蛋白(Motor Protein)的牽引下與鑲嵌在合成聚合物膜上的納米孔蛋白(Nanopore Protein)結(jié)合并解螺旋际邻;在膜兩側(cè)電壓差的作用下,RNA鏈以一定的速率通過(guò)納米孔通道蛋白芍阎。由于RNA鏈上不同堿基化學(xué)性質(zhì)存在差異世曾,所以當(dāng)單個(gè)堿基通過(guò)納米孔通道時(shí),會(huì)引起不同電學(xué)信號(hào)的變化。根據(jù)電流的大小及電流大小的變化情況轮听,通過(guò) “ 遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)”的復(fù)雜算法對(duì)堿基進(jìn)行判讀骗露,即可計(jì)算獲得相應(yīng)堿基的類型,同時(shí)獲得堿基修飾信息(圖1血巍,圖10) ---- 使得ONT三代測(cè)序平臺(tái)可以對(duì)全長(zhǎng)mRNA序列進(jìn)行直接測(cè)序(Direct RNA sequencing)萧锉。
1. ONT - 直接RNA測(cè)序的優(yōu)勢(shì)
- 直接RNA測(cè)序無(wú)需PCR述寡,沒有測(cè)序GC偏好性
由于PCR過(guò)程具有GC偏好性(CG bias)柿隙,對(duì)GC含量過(guò)高或過(guò)低的序列不容易擴(kuò)增,所以短讀長(zhǎng)測(cè)序在建庫(kù)和測(cè)序過(guò)程中都會(huì)引入GC偏好鲫凶,降低了定量分析的準(zhǔn)確性禀崖。使用ONT測(cè)序技術(shù)(直接 cDNA & 直接 RNA),無(wú)需PCR擴(kuò)增螟炫,可以提供無(wú)偏倚(bias)波附、全長(zhǎng)、鏈特異性的RNA序列昼钻。
- 準(zhǔn)確檢測(cè)轉(zhuǎn)錄本 poly(A) 尾長(zhǎng)度
轉(zhuǎn)錄本 poly(A) 尾被認(rèn)為在轉(zhuǎn)錄后調(diào)控中起到重要作用掸屡,包括mRNA的穩(wěn)定性和翻譯效率。poly(A) 尾長(zhǎng)度可達(dá)數(shù)百個(gè)核苷酸然评,使用短讀長(zhǎng)測(cè)序的數(shù)據(jù)很難進(jìn)行測(cè)量仅财。ONT-直接RNA測(cè)序獲得的全長(zhǎng)轉(zhuǎn)錄本包含 poly(A) 尾信息,利用算法工具計(jì)算出 poly(A) 尾的長(zhǎng)度沾瓦,估算每個(gè)讀長(zhǎng)序列的 poly(A) 尾長(zhǎng)满着,甚至能夠發(fā)現(xiàn)異構(gòu)體 (isoform) 間 poly(A) 尾的區(qū)別。
- 直接RNA測(cè)序鑒定 RNA 堿基修飾信息
反轉(zhuǎn)錄cDNA - PCR擴(kuò)增的建庫(kù)方式需要 PCR擴(kuò)增贯莺,從而丟失了 RNA 分子中的堿基修飾信息。直接RNA測(cè)序不需要擴(kuò)增或鏈合成宁改,這意味著在測(cè)序過(guò)程中缕探,修飾堿基直接穿過(guò)納米孔,在原始信號(hào)中產(chǎn)生與未發(fā)生修飾的堿基不同的電流特征还蹲。通過(guò)特定的軟件算法對(duì)電流特征進(jìn)行識(shí)別爹耗,即可鑒定堿基修飾信息。
2. ONT - 直接RNA測(cè)序推薦用戶
對(duì)天然RNA特征感興趣谜喊,想探索RNA堿基修飾信息潭兽。
想要去除反轉(zhuǎn)錄或PCR的偏倚,即偏好性和錯(cuò)配率斗遏。
對(duì)mRNA兩端非編碼調(diào)控區(qū)域感興趣山卦,如5',3' UTR 和 poly(A)尾。
樣本中存在比較難反轉(zhuǎn)錄的轉(zhuǎn)錄本诵次。
3. ONT - 直接RNA測(cè)序建庫(kù)流程
所用的試劑盒為Direct RNA Sequencing Kit (SQK-RNA004)账蓉,首先準(zhǔn)備 poly(A) 富集的mRNA (300ng/8ul) 或者總RNA(1ug/8ul) 枚碗,通過(guò) poly(T) 引物反轉(zhuǎn)錄合成cDNA鏈(穩(wěn)定mRNA),為RNA-cDNA加上測(cè)序接頭铸本,最后在MinION或PromethION芯片上進(jìn)行測(cè)序(圖11)肮雨,建庫(kù)總用時(shí)大約為2小時(shí)15分鐘∠溏瑁互補(bǔ)cDNA鏈不會(huì)被測(cè)序怨规,只是為了提升RNA的穩(wěn)定性和測(cè)序質(zhì)量。
四锡足、ONT - 直接RNA測(cè)序 數(shù)據(jù)分析
ONT Direct RNA測(cè)序的常規(guī)分析流程(人和mRNA為例)包括:
(1)原始數(shù)據(jù)的質(zhì)控
(2)參考轉(zhuǎn)錄組比對(duì)(將聚類得到全長(zhǎng)轉(zhuǎn)錄本和參考注釋進(jìn)行比對(duì)并分類)
(3)基因功能及轉(zhuǎn)錄本結(jié)構(gòu)注釋
(4)差異基因/轉(zhuǎn)錄異構(gòu)體(isoform)定量&差異表達(dá)分析
(5)差異可變剪切(Alternative Splice)分析
(6)KEGG信號(hào)通路富集波丰、蛋白互作分析
(7)RNA堿基修飾檢測(cè)
(8)Poly(A) 尾長(zhǎng)度估算/可變多聚腺苷化(APA)分析
前六個(gè)分析和全長(zhǎng)轉(zhuǎn)錄組(cDNA/PCR建庫(kù))分析流程一致,具體流程和軟件使用可以參考 Wang, Yunhao, et al. "Nanopore sequencing technology, bioinformatics and applications." Nature Biotechnology. (2021)舱污。這里重點(diǎn)總結(jié)一下 直接RNA測(cè)序所特有的 堿基修飾(6mA) 和 可變多聚腺苷化(APA) 分析呀舔。
1. ONT - 直接RNA測(cè)序(Direct RNA Sequencing,DRS)m6A的數(shù)據(jù)分析工具
對(duì)于快速了解現(xiàn)有的基于ONT DRS平臺(tái)實(shí)現(xiàn)m6A檢測(cè)的算法工具和流程扩灯,一篇深入的評(píng)估測(cè)評(píng)文章無(wú)疑是最佳起點(diǎn)媚赖。這里推薦由 駱觀正 和 張璋 教授合著的論文,該論文于2023年4月5日發(fā)表在《自然通訊》(Nature Communications)上珠插,題為"Systematic comparison of tools used for m6A mapping from nanopore direct RNA sequencing"惧磺。這篇文章對(duì)現(xiàn)有常用的檢測(cè)和量化RNA m6A修飾的算法工具進(jìn)行了全面的測(cè)評(píng)和比較研究(圖12)。通過(guò)此文章捻撑,我們可以了解主流的分析軟件和流程都有哪些磨隘,這里暫不對(duì)這些軟件的使用方法做詳細(xì)的描述,給自己挖個(gè)坑顾患,后面對(duì)于每個(gè)常用軟件出一期使用教程番捂。
基于鑒定修飾核苷酸所使用的策略不同设预,現(xiàn)有的工具大致可分為兩大類(圖12)。第一類犁河,依賴于 檢測(cè)識(shí)別 核苷酸通過(guò)納米孔時(shí)產(chǎn)生的不同電流擾動(dòng)信號(hào)鳖枕,將連續(xù)的電流信號(hào)切分成小的 "events",進(jìn)行堿基的識(shí)別桨螺;利用兩個(gè)比較流行的算法之一宾符,Nanopolish-eventalign 或 Tombo-resquiggle,將每一個(gè)核苷酸和參考序列進(jìn)行比對(duì)灭翔;對(duì)于每一個(gè)核苷酸魏烫,電流信號(hào),例如中位數(shù),平均值则奥,方差和滯留時(shí)間等被提取出來(lái)考润,作為以三個(gè)不同分類方法為基礎(chǔ)軟件的輸入文件:統(tǒng)計(jì)檢驗(yàn)(如 Tombo),機(jī)器學(xué)習(xí)(如 MINES读处, Nanom6A和m6Anet)和聚類(如Nanocompore糊治,xPore)。第二類罚舱,利用由于修飾存在而產(chǎn)生的堿基識(shí)別擾動(dòng)("errors")井辜,這些堿基識(shí)別時(shí)的 "errors"可能代表錯(cuò)配,插入管闷,缺失或不同的堿基質(zhì)量粥脚,結(jié)合比對(duì)結(jié)果,這些信息被搜集和分類包个。在這些擾動(dòng)中識(shí)別修飾堿基刷允,Epinano軟件使用預(yù)先訓(xùn)練的機(jī)器學(xué)習(xí)模型,其它的軟件通過(guò)利用內(nèi)部模型或?qū)φ諛颖具M(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)來(lái)識(shí)別修飾堿基碧囊,如DiffErr树灶,DRUMMER和ELIGOS。
- Dorado (ONT官方)
Dorado是一款高性能糯而、易于使用天通、開源的牛津納米孔測(cè)序數(shù)據(jù)堿基識(shí)別(basecaller)的軟件,也是ONT官方是最新推薦使用的堿基識(shí)別軟件熄驼。其利用官方開發(fā)的Remora訓(xùn)練的核苷酸修飾模型進(jìn)行RNA修飾堿基的識(shí)別像寒。對(duì)于修飾堿基后續(xù)處理分析可使用官方推薦的modkit。
- Tombo
Tombo是一套工具瓜贾,主要用于從納米孔測(cè)序數(shù)據(jù)中鑒定修飾的核苷酸诺祸,可用于RNA修飾堿基的識(shí)別和可視化。Tombo 還提供了用于分析和可視化原始納米孔信號(hào)的工具祭芦。此為早期ONT官方推薦的軟件序臂,最后一個(gè)版本停留在2020年2月20日,現(xiàn)在已經(jīng)停止更新維護(hù)实束,被官方新開發(fā)的Remora所替代。Stoiber, M.H. et al. De novo Identification of DNA Modifications Enabled by Genome-Guided Nanopore Signal Processing. bioRxiv (2016).
- MINES
MINES - (m)6A (I)dentification Using (N)anopor(E) (S)equencing- 文章由來(lái)自UC San Diego的 Gene Yao 教授團(tuán)隊(duì)(圖13)于2020年1月發(fā)表在RNA雜志上逊彭,題目為Direct RNA sequencing enables m6A detection in endogenous transcript isoforms at base-specific resolution咸灿。從github上的日志來(lái)看,已經(jīng)有4-5年沒有更新了侮叮,而且運(yùn)行MINES之前需要運(yùn)行Tombo(v1.4)避矢。
- Nanom6A
Nanom6A,是一款基于XGBoost(Extreme Gradient Boosting)模型,直接利用m6A周圍的原始信號(hào)审胸,在單核苷酸水平上對(duì)每一個(gè)轉(zhuǎn)錄本進(jìn)行m6A位點(diǎn)的鑒別亥宿。此流程由福建農(nóng)林大學(xué)海峽聯(lián)合研究院林學(xué)中心的 顧連峰 教授課題組于2021年1月7日,在Genome Biology上發(fā)表: Quantitative profiling of N6-methyladenosine at single-base resolution in stem-differentiating xylem of Populus trichocarpa using Nanopore direct RNA sequencing砂沛。該研究提供了一種可在單轉(zhuǎn)錄本單堿基水平的分辨率定量m6A修飾的方法烫扼,為在動(dòng)植物中的m6A修飾研究提供了一種極為有效的檢測(cè)手段。默認(rèn)模型只適用于 MinION 或 GridION機(jī)型的 R9.4.1 芯片碍庵。
- m6Anet
m6anet 映企,利用多實(shí)例學(xué)習(xí)(Multiple Instance Learning)框架來(lái)從納米孔直接RNA測(cè)序數(shù)據(jù)中檢測(cè) m6A 修飾。新加坡 A-STAR 基因組研究所 (GIS) / 新加坡國(guó)立大學(xué) Jonathan Goke (圖14)與 Alexandre Thiery 研究組合作于2022年11月10日静浴,在Nature Methods上發(fā)表了題目為Detection of m6A from direct RNA sequencing using a multiple instance learning framework的研究論文堰氓。該研究提出了一種基于神經(jīng)網(wǎng)絡(luò)檢測(cè) RNA 修飾的新方法,m6Anet 苹享。m6Anet 可以從單次直接 RNA 測(cè)序數(shù)據(jù)中獲得轉(zhuǎn)錄組范圍內(nèi)的 m6A 識(shí)別和量化信息双絮。最新的版本為v.2.1.0,最近更新于2023年07月23號(hào)得问。
- Nanocompore
Nanocompore用于比較來(lái)自兩個(gè)不同實(shí)驗(yàn)組的ONT-直接RNA測(cè)序數(shù)據(jù)集囤攀,來(lái)檢測(cè)差異的RNA修飾,建議每組有兩個(gè)重復(fù)樣本椭赋。英國(guó)劍橋大學(xué) Tony Kouzarides 教授團(tuán)隊(duì)于2021年12月10日抚岗,在Nature Communications上發(fā)表了RNA modifications detection by comparative Nanopore direct RNA sequencing的研究。團(tuán)隊(duì)開發(fā)并驗(yàn)證了Nanocompore軟件哪怔,一個(gè)可以從Nanopore direct RNA-seq測(cè)序數(shù)據(jù)中識(shí)別堿基修飾的分析框架(圖15)宣蔚。將感興趣的RNA和未做處理的對(duì)照樣本進(jìn)行比較,不需要訓(xùn)練集认境,并且允許重復(fù)樣本數(shù)據(jù)胚委。Nanocompore**在體外可以準(zhǔn)確地檢測(cè)到不同的RNA修飾,也可以用于酵母和人類RNA中m6A修飾圖譜叉信,以及靶向非編碼RNA的鑒別亩冬。
- xPore
xPore是一款基于Python語(yǔ)言利用ONT-直接RNA測(cè)序數(shù)據(jù)對(duì)RNA修飾進(jìn)行鑒定和定量。新加坡 A-STAR 基因組研究所(GIS)/ 新加坡國(guó)立大學(xué) Jonathan Goke 研究組和深圳灣實(shí)驗(yàn)室分子生理學(xué)研究所 吳煒祥(W.S. Sho Goh) 課題組于2021年7月19日硼身,在Nature Biotechnology雜志上發(fā)表了題為Identification of differential RNA modifications from nanopore direct RNA sequencing with xPore的研究硅急,開發(fā)了基于Nanopore direct RNA-seq的RNA修飾差異化分析計(jì)算方法xPore。xPore可以實(shí)現(xiàn)單堿基水平(single-base resolution )的甲基化位點(diǎn)鑒定佳遂、甲基化水平計(jì)算营袜,在沒有配對(duì)未修飾樣品對(duì)照組的情況下進(jìn)行樣品間的甲基化差異分析,xPore為臨床樣本丑罪、原代培養(yǎng)組織等缺乏相應(yīng)對(duì)照組的甲基化差異分析提供了技術(shù)支持荚板。最新的版本為v.2.1凤壁,更新于2021年10月09號(hào)。
- Epinano
Epinano是一款利用ONT-直接RNA測(cè)序數(shù)據(jù)檢測(cè)RNA修飾的軟件跪另。西班牙巴塞羅那科學(xué)研究院(Barcelona Institute of Science and Technology)的 Eva Maria Novoa 團(tuán)隊(duì)(圖15)于2019年9月9號(hào)拧抖,在Nature Communications上發(fā)表了題目為Accurate detection of m6A RNA modifications in native RNA sequences的研究, 開發(fā)了利用Nanopore direct RNA-seq數(shù)據(jù)預(yù)測(cè)RNA中m6A修飾的算法,名為EpiNano免绿,此算法基于系統(tǒng)誤差和堿基質(zhì)量下降等信息檢測(cè)m6A修飾唧席。最新的版本為v.1.2.4,更新于2024年4月27號(hào)针姿。
- DiffErr
DiffErr是由英國(guó)鄧迪大學(xué)(University of Dundee)Geoff Barton 團(tuán)隊(duì)開發(fā)的算法袱吆。算法基于Nanopore DRS測(cè)序的錯(cuò)誤,需要低堿基修飾的對(duì)照距淫。輸入數(shù)據(jù)需要測(cè)序樣本使用同一芯片绞绒,同一建庫(kù)試劑盒,同一時(shí)間完成測(cè)序榕暇,并且使用相同軟件算法來(lái)call堿基蓬衡,否則就會(huì)有大量假陽(yáng)性。軟件最后一次更新停留在2020年11月27號(hào)彤枢,對(duì)于不同批次的數(shù)據(jù)非常不友好狰晚。
- DRUMMER
DRUMMER旨在通過(guò)比較ONT-直接RNA測(cè)序數(shù)據(jù)集中的堿基鑒別錯(cuò)誤(basecall errors),識(shí)別不同轉(zhuǎn)錄本異構(gòu)體上的RNA修飾缴啡,達(dá)到核苷酸級(jí)別的分辨率壁晒。美國(guó)紐約大學(xué) Daniel P Depledge 團(tuán)隊(duì)于2022年4月15號(hào),在Bioinformatics上發(fā)表了題目為DRUMMER—rapid detection of RNA modifications through comparative nanopore sequencing的研究业栅,開發(fā)了DRUMMER (Detection of Ribonucleic acid Modifications Manifested in Error Rates) 算法軟件秒咐。算法基于一系列統(tǒng)計(jì)學(xué)檢驗(yàn)和信號(hào)背景噪音校正來(lái)鑒定修飾的核酸堿基。軟件自發(fā)表以來(lái)沒有進(jìn)行更新碘裕。
- ELIGOS
ELIGOS 是一款利用天然RNA和參考序列之間特定堿基上的錯(cuò)誤(error at specific base携取,ESB)差異,來(lái)識(shí)別RNA序列上修飾位點(diǎn)而開發(fā)的軟件帮孔。美國(guó)阿肯色大學(xué)醫(yī)學(xué)院(University of Arkansas for Medical Sciences) 的 Intawat Nookaew 教授團(tuán)隊(duì)和芝加哥大學(xué)的 何川 教授團(tuán)隊(duì)于2021年1月25號(hào)雷滋,在Necleic Acids Research上發(fā)表了題目為Decoding the epitranscriptional landscape from native RNA sequences的研究,開發(fā)了ELIGOS(Epitranscriptional/(Epigenomical) Landscape Inferring from Glitches of ONT Signals)文兢。ELIGOS能夠在大腸桿菌晤斩、酵母和人類細(xì)胞中準(zhǔn)確預(yù)測(cè)已知類別的RNA甲基化位點(diǎn)。
- 其它分析軟件
在 Jonathan Goke 實(shí)驗(yàn)室github主頁(yè)的 awesome-nanopore 里有一個(gè)關(guān)于ONT數(shù)據(jù)分析軟件的列表姆坚,里面總結(jié)了相應(yīng)方向數(shù)據(jù)分析推薦的軟件尸昧。其中也推薦了RNA修飾方向的一系列相關(guān)軟件(圖16)。大家也可以自行查看參考綜述里沒提及的分析軟件旷偿,例如nanoDoc2烹俗。
2、RNA可變多聚腺苷酸化(alternative polyadenylation, APA)原理及分析工具
mRNA在加工過(guò)程中的精細(xì)調(diào)控對(duì)基因的表達(dá)具有重要影響萍程,也是產(chǎn)生基因功能多樣性的重要機(jī)制幢妄。真核生物mRNA3' 端都由一個(gè)約200個(gè)腺苷的 ploy(A) 尾組成。前體mRNA(pre-mRNA)在成熟過(guò)程中茫负,環(huán)境或生理的細(xì)微變化能夠?qū)е略?strong>mRNA的不同剪切位點(diǎn)上進(jìn)行選擇性的剪切和多聚腺苷酸化(cleavage and polyadenylation, C/P)蕉鸳,可變剪切和多聚腺苷酸化的發(fā)生需要多聚腺苷酸化信號(hào)(polyadenylation signal,PAS忍法,典型序列AAUAAA)的存在潮尝。可變多聚腺苷化(Alternative polyadenylation, APA)則是指具有多個(gè) PAS 的序列饿序,在其mRNA的3' 端成熟過(guò)程中勉失,由于選擇不同的PAS,導(dǎo)致產(chǎn)生出多個(gè)3' UTR長(zhǎng)度和序列組成不同的轉(zhuǎn)錄異構(gòu)體 (圖17)原探。
一般可變多聚腺苷化(APA)乱凿,可以分為四種類型:
3' UTR APA:3' UTR區(qū)內(nèi)有兩個(gè)或者兩個(gè)以上的PAS,如 Proximal PAS(近端)和 Distal PAS(遠(yuǎn)端)咽弦,產(chǎn)生具有不同長(zhǎng)度的3' UTR的異構(gòu)體(isoform)徒蟆,并不影響蛋白編碼功能,是最常見的APA形式 (圖17 A)型型。
可變末端外顯子APA 或稱 剪切APA:產(chǎn)生末端外顯子和3'UTR不同的異構(gòu)體(isoform)段审,影響編碼蛋白C端氨基酸的序列(圖17 B)。
內(nèi)含子APA:內(nèi)含子區(qū)域存在PAS闹蒜,延長(zhǎng)了某個(gè)內(nèi)部外顯子并使之成為末端外顯子(圖17 C)寺枉。
內(nèi)部外顯子APA:在編碼區(qū)域內(nèi)部發(fā)生剪切和多聚腺苷酸化(圖17 D)。
通過(guò)在RNA 3' UTR區(qū)不同位置上添加polyA尾巴型凳,可以選擇性的調(diào)節(jié)3' UTR的長(zhǎng)短。由于3' UTR區(qū)含有多種順式調(diào)控元件嘱函,例如:miRNA或RNA結(jié)合蛋白(RBP)結(jié)合位點(diǎn)甘畅,因此,APA可以通過(guò)調(diào)節(jié)3' UTR區(qū)的長(zhǎng)度往弓,影響目標(biāo)mRNA的穩(wěn)定性硅瞧,定位和翻譯效率,最終導(dǎo)致它們具有不同的生物學(xué)功能苔巨; 發(fā)生在編碼區(qū)內(nèi)部的APA可以影響蛋白質(zhì)翻譯序列店乐,進(jìn)而影響其生物學(xué)功能。
對(duì)于三代測(cè)序數(shù)據(jù)RNA可變多聚腺苷酸化分析工具撇寞,大家可以自行探索以下軟件顿天,如TAPAS堂氯,DaPars,NanoPrapi牌废,LAPA咽白,DeeReCT-APA,DeepPASTA等鸟缕。因?yàn)楸救瞬皇亲鲞@個(gè)方向晶框,如有不全或錯(cuò)誤之處還請(qǐng)大家?guī)兔ρa(bǔ)充和更正。
對(duì)于估計(jì)polyA長(zhǎng)度的軟件:
- Dorado (ONT官方)
Dorado是一款高性能懂从、易于使用授段、開源的牛津納米孔測(cè)序數(shù)據(jù)堿基識(shí)別(basecaller)的軟件,也是ONT官方是最新推薦使用的堿基識(shí)別軟件番甩。使用 --estimate-poly-a
命令選項(xiàng)即可開啟預(yù)估poly(A)長(zhǎng)度選項(xiàng)侵贵。
- tailfindr
tailfindr 是一款利用ONT reads來(lái)估算polyA尾長(zhǎng)度的R包。
挪威卑爾根大學(xué)(University of Bergen)Eivind Valen 教授團(tuán)隊(duì)于2019年10月25號(hào)对室,在RNA上發(fā)表了題目為tailfindr: alignment-free poly(A) length measurement for Oxford Nanopore RNA and DNA sequencing的研究模燥,開發(fā)了名為tailfindr的R包。 tailfindr可以直接從ONT原始的FAST5格式數(shù)據(jù)直接估計(jì)每條序列的 poly(A) 長(zhǎng)度掩宜。
五蔫骂、RNA表觀遺傳修飾類型以及功能
ONT - Direct RNA Sequecing (DRS,直接RNA測(cè)序)技術(shù)主要優(yōu)勢(shì)之一還是在于其能直接檢測(cè)RNA上的表觀遺傳修飾牺汤。
之前大家圍繞染色質(zhì)上的 DNA 和 Protein 開始表觀遺傳學(xué)的研究辽旋,包括DNA 甲基化,染色質(zhì)可及性檐迟,組蛋白修飾补胚,3D 基因組等等 (圖18)。傳統(tǒng)經(jīng)典的遺傳學(xué)基本法則(Central dogma, 中心法則)中的RNA確"被大家忽略了"追迟。這種尷尬的局面溶其,在2011 年10月16號(hào),由芝加哥大學(xué)何川教授團(tuán)隊(duì)率先打破敦间。他們的研究 "N6-methyladenosine in nuclear RNA is a major substrate of the obesity-associated FTO" 發(fā)表在 Nature Chemical Biology上瓶逃,首次證明 FTO(fat mass and obesity-associated protein)是RNA上m6A(N6-methyladenosine)修飾的去甲基化酶,揭示m6A的可逆化修飾廓块,且說(shuō)明了RNA 層面的修飾也參與了基因表達(dá)調(diào)控厢绝。m6A作為mRNA上最豐富的可逆修飾受到了極大地關(guān)注,并從此開啟了RNA表觀遺傳學(xué)的浪潮带猴,使 m6A 的研究重新熱門起來(lái)昔汉。
“隨著ONT direct RNA技術(shù)的發(fā)展與普及,將會(huì)極大推動(dòng)RNA表觀遺傳學(xué)的研究”拴清。
RNA表觀遺傳修飾是指發(fā)生在RNA堿基上的各種化學(xué)修飾,這些修飾通常不會(huì)改變基因的序列嫡秕,但會(huì)影響其在細(xì)胞內(nèi)的穩(wěn)定性渴语、結(jié)構(gòu)、功能昆咽、剪接加工、轉(zhuǎn)運(yùn)定位牙甫、聚腺苷酸化(polyadenylation)掷酗、翻譯等從而調(diào)控多種生物過(guò)程。在生物體內(nèi)窟哺,RNA修飾是通過(guò)多種酶在轉(zhuǎn)錄后或共轉(zhuǎn)錄時(shí)引入的泻轰,RNA分子也可以從外部來(lái)源獲得修飾,如環(huán)境或其它生物體且轨。迄今為止浮声,根據(jù)波蘭華沙國(guó)際分子與細(xì)胞生物學(xué)研究所 (IIMCB) ,Janusz M. Bujnicki 教授團(tuán)隊(duì)(圖19旋奢,圖20)開發(fā)的RNA修飾數(shù)據(jù)庫(kù)MODOMICS顯示泳挥,在所有類型的RNA分子中已經(jīng)確定了超過(guò)170種RNA修飾(從2006年更新至2023年)(Cappannini, A; Bujnicki, J. M.et.al),編碼RNA (mRNA)和非編碼RNA(tRNA, rRNA, miRNA, lncRNA, circRNA, etc.)都可以被修飾(圖21)≈晾剩現(xiàn)在認(rèn)為表觀遺傳修飾和遺傳物質(zhì) DNA 一樣屉符,都是決定基因表達(dá)和個(gè)體表型的重要因素,與生物發(fā)育和疾病發(fā)生息息相關(guān)锹引。
當(dāng)前已知的RNA修飾之中矗钟,研究較多的RNA修飾如下(圖21):
① N6-甲基腺苷(N6-methyladenosine, m6A)
② 5-甲基胞嘧啶(5-methylcytosine, m5C)
③ N1-甲基腺苷(N1-methyladenosine, m1A)
④ N7-甲基鳥苷(N7-methylguanosine, m7G)
⑤ N4- 乙酰胞嘧啶 (N4-acetylcytosine, ac4C)
⑥ 假尿苷 (pseudouridine, Ψ)
⑦ 尿苷化(uridylation)
⑧ 腺苷到肌苷的RNA 編輯(adenosine-to-inosine (A-to-I) RNA editing)
N6-甲基腺嘌呤(m6A)嫌变,即腺苷酸氮堿基 的6號(hào)位 N 發(fā)生甲基化吨艇, 是mRNA中豐度最高的甲基化修飾形式,也是目前研究最為透徹的一種RNA修飾類型腾啥。其可以被甲基轉(zhuǎn)移酶“寫”东涡、去甲基酶“擦除”及結(jié)合蛋白“讀”。在第一個(gè)去甲基化酶 FTO 被發(fā)現(xiàn)后碑宴,在眾多科學(xué)家的共同努力下软啼,逐漸構(gòu)建起了較為清晰的 m6A 修飾通路。這里包含三種核心調(diào)控因子:Writer(寫)延柠,Eraser(擦除)祸挪,Reader(讀取)贞间,它們分別執(zhí)行針對(duì) m6A 的三種任務(wù):加入修飾贿条,擦除修飾雹仿,讀取修飾 (圖22,參考知乎-白墨)整以。
加入修飾(Writer)胧辽,主要由甲基化轉(zhuǎn)移酶構(gòu)成的復(fù)合物(Methyltransferase complex,MTC)介導(dǎo)產(chǎn)生公黑,包括 METTL3邑商、METTL14和 WTAP和 KIAA1429。
擦除修飾(Eraser)凡蚜,F(xiàn)TO 和 ALKHB5 等去甲基化酶構(gòu)成人断,用于擦除甲基化基團(tuán)。FTO蛋白全稱Fat mass and obesity-associated protein朝蜘,屬于Alkb蛋白家族中的一員并且與肥胖相關(guān)恶迈,敲除后,m6A修飾水平顯著上升谱醇。LKBH5是另一種重要的去甲基化酶暇仲,對(duì)細(xì)胞核中的mRNA進(jìn)行去甲基化修飾。在細(xì)胞系中敲低ALKBH5后副渴,mRNA上m6A修飾水平顯著上升奈附。
讀取修飾(Reader),多種 Reader 蛋白會(huì)執(zhí)行不同的生物學(xué)功能佳晶,常見的有:
- YTHDF1 和 YTHDF3 通過(guò)與起始因子及核糖體互相作用促進(jìn)蛋白質(zhì)翻譯
- YTHDF2 導(dǎo)致 mRNA 的降解桅狠,而 YTHDF3 與 YTHDC2 有類似的功能
- IGF2BP1/2/3 則對(duì)翻譯的穩(wěn)定性有促進(jìn)作用
- YTHDC1 與 mRNA 剪切及出核有關(guān)
- eIF3 識(shí)別蛋白也會(huì)直接綁定到 mRNA 5'UTR 端的 m6A 位點(diǎn)參與翻譯起始
- HNRNPC 介導(dǎo) mRNA 前體的選擇性剪接
- HNRNPA2B1 促進(jìn) pri-miRNA 加工為 pre-miRNA
六、ONT - 直接RNA測(cè)序 應(yīng)用場(chǎng)景
Oxford Nanopore Technologies (ONT) 測(cè)序平臺(tái)的直接RNA測(cè)序技術(shù)是一種能夠直接測(cè)定RNA分子序列以及其表觀遺傳修飾的方法轿秧,不需要將RNA逆轉(zhuǎn)錄為cDNA中跌。
這種技術(shù)除了常規(guī)的轉(zhuǎn)錄組分析應(yīng)用,如:
-
全長(zhǎng)轉(zhuǎn)錄本鑒定:
- 直接RNA測(cè)序能夠測(cè)定完整的RNA分子菇篡,避免了傳統(tǒng)測(cè)序方法中由于逆轉(zhuǎn)錄和片段化引入的偏差漩符。這對(duì)于研究全長(zhǎng)轉(zhuǎn)錄本結(jié)構(gòu)、剪接變體和基因融合事件非常重要驱还。
-
轉(zhuǎn)錄組分析:
- 可以用于生物樣本的轉(zhuǎn)錄組分析嗜暴,幫助識(shí)別和定量表達(dá)基因和轉(zhuǎn)錄本。這對(duì)于揭示差異表達(dá)基因(或轉(zhuǎn)錄本)和功能具有重要意義议蟆。
-
癌癥研究:
- 能夠識(shí)別癌癥細(xì)胞中的異常轉(zhuǎn)錄事件和基因融合闷沥,對(duì)于理解癌癥的分子機(jī)制、發(fā)現(xiàn)新的生物標(biāo)志物和開發(fā)新的治療策略具有重要應(yīng)用咐容。
其還有許多獨(dú)特的應(yīng)用場(chǎng)景和優(yōu)勢(shì)舆逃,包括以下幾個(gè)方面:
-
病毒和病原體檢測(cè):
- 在病毒學(xué)研究中,直接RNA測(cè)序可以快速、準(zhǔn)確地測(cè)定病毒RNA序列路狮,有助于病毒株的鑒定虫啥、突變檢測(cè)和流行病學(xué)研究。尤其適用于RNA病毒奄妨,如冠狀病毒涂籽、流感病毒等。
- 探索病毒生命周期砸抛、變異監(jiān)控评雌、宿主-病毒互作以及病毒基因表達(dá)的復(fù)雜性方面。
-
合成生物學(xué):
- 在合成生物學(xué)研究中直焙,可以用于測(cè)定和驗(yàn)證人工合成的RNA分子柳骄,確保其序列和結(jié)構(gòu)的準(zhǔn)確性。
-
藥物研發(fā):
- 在藥物研發(fā)過(guò)程中箕般,直接RNA測(cè)序可以用于評(píng)估藥物對(duì)基因表達(dá)和RNA修飾的影響,從而加速藥物篩選和優(yōu)化舔清。
直接RNA測(cè)序技術(shù)的這些應(yīng)用場(chǎng)景表明丝里,它不僅在基礎(chǔ)研究中具有重要價(jià)值,而且在臨床診斷体谒、公共衛(wèi)生和生物技術(shù)產(chǎn)業(yè)中也具有廣泛的應(yīng)用前景杯聚。
參考文獻(xiàn):
- Stark, R., Grzelak, M., & Hadfield, J. (2019). RNA sequencing: the teenage years. Nature Reviews Genetics.
- Nature重磅綜述 |關(guān)于RNA-seq,你想知道的都在這抒痒。生信寶典-陳同幌绍。
- Wang, Y., Zhao, Y., Bollas, A., Wang, Y., & Au, K. F. (2021). Nanopore sequencing technology, bioinformatics and applications. Nature Biotechnology.
- Nanopore直接RNA測(cè)序--希望組。
- NGS mRNA建庫(kù)完全攻略—從mRNA純化到注意事項(xiàng) (翌圣生物)故响。
- “Sudhagar, A.; Kumar, G.; El-Matbouli, M. (2018)Transcriptome Analysis Based on RNA-Seq in Understanding Pathogenic Mechanisms of Diseases and the Immune System of Fish: A Comprehensive Review. Int. J. Mol. Sci.
- Grünberger, F., Knüppel, R., Jüttner, M., Fenk, M., Borst, A., Reichelt, R., ... & Grohmann, D. (2019). Nanopore-based native RNA sequencing provides insights into prokaryotic transcription, operon structures, rRNA maturation and modifications. bioRxiv.
- Xiong, Q., Jiang, H., Liu, Z., Peng, J., Sun, J., Fang, L., ... & Lu, J. (2022). Untangling an AGS outbreak caused by the recombinant GII. 12 [P16] norovirus with nanopore sequencing. Frontiers in Cellular and Infection Microbiology.
- 一文讀懂 RNA 表觀修飾--知乎白墨傀广。
- Jia, G., Fu, Y. E., Zhao, X. U., Dai, Q., Zheng, G., Yang, Y., ... & He, C. (2011). N6-methyladenosine in nuclear RNA is a major substrate of the obesity-associated FTO. Nature chemical biology.
- Cui, L., Ma, R., Cai, J., Guo, C., Chen, Z., Yao, L., ... & Shi, Y. (2022). RNA modifications: importance in immune cell biology and related diseases. Signal transduction and targeted therapy.
- Barbieri, I., & Kouzarides, T. (2020). Role of RNA modifications in cancer. Nature Reviews Cancer.
- 綜述學(xué)習(xí) | RNA修飾的類型及其調(diào)控蛋白
- Cappannini, A., Ray, A., Purta, E., Mukherjee, S., Boccaletto, P., Moafinejad, S. N., ... & Bujnicki, J. M. (2024). MODOMICS: a database of RNA modifications and related information. 2023 update. Nucleic Acids Research.
- Liu, Z., Gao, L., Cheng, L., Lv, G., Sun, B., Wang, G., & Tang, Q. (2023). The roles of N6-methyladenosine and its target regulatory noncoding RNAs in tumors: classification, mechanisms, and potential therapeutic implications. Experimental & Molecular Medicine.
- 科普篇|上百種RNA修飾,除了m6A和m5C彩届,你還知道多少伪冰?
- Dapars2 分析可變多聚腺苷酸化(APA 3’UTR)與腫瘤 - 小白要變大神
- 這個(gè)好像都沒聽說(shuō)過(guò)的機(jī)制,到底為什么成為國(guó)自然熱點(diǎn) - 課題指南針 (伍師妹)
- Zhang, Y., Liu, L., Qiu, Q., Zhou, Q., Ding, J., Lu, Y., & Liu, P. (2021). Alternative polyadenylation: methods, mechanism, function, and role in cancer. Journal of Experimental & Clinical Cancer Research.
- Gao, Y., Liu, X., Wu, B., Wang, H., Xi, F., Kohnen, M. V., ... & Gu, L. (2021). Quantitative profiling of N 6-methyladenosine at single-base resolution in stem-differentiating xylem of Populus trichocarpa using Nanopore direct RNA sequencing. Genome Biology.
- Lorenz, D. A., Sathe, S., Einstein, J. M., & Yeo, G. W. (2020). Direct RNA sequencing enables m6A detection in endogenous transcript isoforms at base-specific resolution. RNA.