前言
這一部分的內(nèi)容主要涉及單細(xì)胞測(cè)序,空間轉(zhuǎn)錄組篮赢,新生RNA測(cè)序,翻譯組琉挖,RNA-RNA之間相互作用启泣,RNA-蛋白質(zhì)相互作用以及未來(lái)展望。
常規(guī)RNA-seq進(jìn)階
源于整塊組織和/或大量細(xì)胞的RNA-seq數(shù)據(jù)已經(jīng)徹底改變了我們對(duì)生物學(xué)的理解示辈,但是這種常規(guī)的RNA-seq無(wú)法輕易地分辨出特定的細(xì)胞類(lèi)型寥茫,也無(wú)法保存空間信息,而這兩個(gè)信息都是理解生物系統(tǒng)復(fù)雜性的關(guān)鍵因素矾麻。促進(jìn)研究者們從常規(guī)的RNA-seq走出去的情形與常規(guī)RNA-seq當(dāng)初出現(xiàn)的理由類(lèi)似纱耻,但這種進(jìn)階能夠能夠解決很多不同的問(wèn)題。單細(xì)胞測(cè)序讓人們發(fā)現(xiàn)了险耀,即使在被認(rèn)為研究透徹的疾病背后弄喘,還存在著一些未知細(xì)胞類(lèi)型,例如發(fā)現(xiàn)了離子細(xì)胞(ionocyte cell)甩牺,這類(lèi)細(xì)胞可能與囊性纖維化疾病有關(guān)蘑志。
空間分辨RNA-seq則提示了在實(shí)體組織中細(xì)胞與細(xì)胞之間的相互作用,例如發(fā)現(xiàn)了成年心臟組織中一小群胎兒標(biāo)記基因表達(dá)的細(xì)胞。雖然在可預(yù)見(jiàn)的未來(lái)卖漫,常規(guī)RNA-seq仍然是一個(gè)占據(jù)主導(dǎo)地位的工具。但是赠群,單細(xì)胞測(cè)序與分析方法正在快速地被研究者利用羊始,并且隨著空間RNA-seq方法的成熟,它們有可能成為常規(guī)RNA-seq分析中的一部分查描。這兩種方法都將提高我們對(duì)多細(xì)胞生物體復(fù)雜性的理解突委,它們都有可能與常規(guī)RNA-seq方法結(jié)合使用。在這里我們簡(jiǎn)單描述一下主要的單細(xì)胞測(cè)序以及空間RNA-seq方法冬三,以及它們與常規(guī)RNA-seq的不同之處匀油,以及新的研究者們?nèi)绾沃帧?/p>
單細(xì)胞分析
scRNA-seq于2009年首次報(bào)道,當(dāng)時(shí)的研究者在含有裂解緩沖液的EP管中分離了單個(gè)卵母細(xì)胞勾笆。單細(xì)胞測(cè)序?qū)ι飳W(xué)新問(wèn)題的解釋?zhuān)约艾F(xiàn)有的實(shí)驗(yàn)室和計(jì)算方法以極快的速度發(fā)展敌蚜,甚至最近幾年綜述都已經(jīng)過(guò)時(shí)了。每種scRNA-seq方法都需要將實(shí)體組織進(jìn)行分離窝爪,分離出單個(gè)細(xì)胞(使用不同的方法)弛车,以及標(biāo)記上每個(gè)細(xì)胞的RNA,對(duì)RAN擴(kuò)增后進(jìn)行測(cè)序蒲每,所有的這些方法都來(lái)源于早期常規(guī)RNA-seq的方法纷跛。
機(jī)械裂解和膠原酶加DNAase的酶解會(huì)生成單細(xì)胞懸液,從而產(chǎn)生大量可用的細(xì)胞邀杏,但是這種產(chǎn)生是高度組織特異性的贫奠,比較依賴(lài)于經(jīng)驗(yàn),其過(guò)程也需要非常小心望蜡。一旦制備好了單細(xì)胞懸液唤崭,就可以通過(guò)各種方法分離單細(xì)胞(FIG 3a);
大多數(shù)的實(shí)驗(yàn)都是使用流式細(xì)胞儀來(lái)進(jìn)行單細(xì)胞分選泣特,這種方法是最容易浩姥,它可以將單個(gè)細(xì)胞直接分選到含有裂解液的微孔板中。對(duì)于更高通量的實(shí)驗(yàn)状您,現(xiàn)存有大量分離單細(xì)胞的專(zhuān)門(mén)儀器勒叠,這些儀器需要自己構(gòu)建或購(gòu)買(mǎi)。單個(gè)細(xì)胞可以通過(guò)物理手段被捕獲到微流控芯片中膏孟,或者是通過(guò)Poisson分布的原理被分配到加載到含有納米孔(nanowell)的芯片中眯分,隨后這些單細(xì)胞被分離后就被液滴微流分離技術(shù)合并到含有試劑的液滴中(例如Drop-Seq與InDrop),或者是單細(xì)胞被原位標(biāo)記上標(biāo)簽(例如單細(xì)胞混合索引RNA測(cè)序技術(shù), single-cell combinatorial indexing RNA sequencing, sci-RNA-seq以及分離-混合-連接轉(zhuǎn)錄組測(cè)序技術(shù)柒桑,split- pool ligation- based transcriptome sequencing,SPLiT-seq)弊决。單細(xì)胞分離后,它們就被裂解,將RNA釋放到溶解中用于cDNA合成飘诗,并將cDNA用于RNA-seq文庫(kù)制備与倡。
在文庫(kù)制備過(guò)程中,來(lái)源于每個(gè)細(xì)胞的RNA會(huì)通過(guò)PCR進(jìn)行擴(kuò)增昆稿。這種擴(kuò)增就引入了PCR偏倚纺座,但是UMIs可以用于校正這種偏倚。由于Poisson采樣溉潭,一個(gè)細(xì)胞中只有10-20%的轉(zhuǎn)錄本會(huì)被逆轉(zhuǎn)錄净响,這就限制了轉(zhuǎn)錄本檢測(cè)的靈敏度,以及各種方法產(chǎn)生的可用數(shù)據(jù)喳瓣。在濕實(shí)驗(yàn)之外馋贤,計(jì)算方法也在迅速發(fā)展,最近已經(jīng)出現(xiàn)了關(guān)于scRNA-seq的實(shí)驗(yàn)設(shè)計(jì)指南畏陕。方法學(xué)的快速發(fā)展意味著scRNA-seq方法的技術(shù)已經(jīng)快速過(guò)時(shí)了配乓。然而Ziegenhain等人提供了scRNA-seq方法的詳細(xì)概述,他著重強(qiáng)調(diào)了UMIs的在數(shù)據(jù)分析方面 的重要性惠毁,并報(bào)道了提到了的6種方法中哪一種最為靈敏扰付。然而他們的研究范圍并不包括現(xiàn)在被廣泛使用的10X Geneomics方法。
Figure3-單細(xì)胞RNA-seq與空間RNA-seq的概念
Figure 3-單細(xì)胞RNA-seq與空間RNA-seq的概念仁讨。
(a)單細(xì)胞RNA-seq(scRNA-seq)工作流程概述羽莺。scRNA-seq的第一步就是從樣本中分離單個(gè)細(xì)胞(例如從解離的皮膚組織),分離單細(xì)胞的方式有多種洞豁,其中包括微移液管將細(xì)胞轉(zhuǎn)移到單獨(dú)的微管中盐固,或者是使用流式細(xì)胞儀將單細(xì)胞分選到含有裂解液的96孔板或384孔板中,或者是將細(xì)胞捕獲到微流控芯片中丈挟,或者是將細(xì)胞分布到納米孔(nanowells)中刁卜,或者是使用含有試劑的液滴分離系統(tǒng),或者是使用原位條形碼技術(shù)曙咽。
細(xì)胞進(jìn)行逆轉(zhuǎn)錄以產(chǎn)生cDNA(通常使用UMIs來(lái)對(duì)這些cDNA進(jìn)行標(biāo)記)蛔趴,用于制備RNA-seq文庫(kù)和測(cè)序。
質(zhì)控(QC)例朱,差異基因表達(dá)(DGE)與2D可視化(t-distributed stochastic neighbour embedding, tSNE)以及無(wú)監(jiān)督聚類(lèi)在和網(wǎng)絡(luò)分析來(lái)對(duì)scRNA-seq的數(shù)據(jù)進(jìn)行分析孝情,用于區(qū)分不同的細(xì)胞種群。這些技術(shù)通常會(huì)標(biāo)明細(xì)胞數(shù)據(jù)洒嗤,以及與RNA-seq的策略一樣箫荡,還會(huì)標(biāo)明測(cè)序技術(shù)是3’末端還是5’末端還是全長(zhǎng)cDNA。
(b)空間轉(zhuǎn)錄組學(xué)工作流程概述渔隶。空間編碼需要將冷凍組織切片加到含有寡聚核苷酸微陣列的載玻片上羔挡,或者是加載到密集包裝的被寡核苷酸包被的pucks上。mRNA擴(kuò)散到載玻片表面,然后與oligo-dT合成引物雜交绞灼,這些引物中含有UMIs與空間編碼序列利术。隨后mRNA逆轉(zhuǎn)錄成cDNA,cDNA匯集起來(lái)用于文庫(kù)制備和測(cè)序低矮÷认空間轉(zhuǎn)錄本組學(xué)的計(jì)算方法以能夠?qū)y(cè)序讀長(zhǎng)回貼到它們的空間坐標(biāo)上,隨后是DGE分析與差異空間表達(dá)分析的可視化商佛。scRNA-seq與空間RNA-seq數(shù)據(jù)通常是用短讀長(zhǎng)測(cè)序儀進(jìn)行測(cè)序的芳杏。上述圖片(a)源于Springer Nature Limited允青。
當(dāng)研究者們?cè)谶x擇scRNA-seq方法酝碳,需要考慮的主要因素包括:他們是否需要全長(zhǎng)轉(zhuǎn)錄本的讀長(zhǎng)文搂,在分析更多細(xì)胞表達(dá)譜(寬度, breadth)或每個(gè)細(xì)胞更多轉(zhuǎn)錄本(深度旁舰,depth)之間進(jìn)行權(quán)衡罪帖,以及總體實(shí)驗(yàn)成本披诗。全長(zhǎng)scRNA-seq系統(tǒng)的通量比較低俱萍,因此每個(gè)細(xì)胞需要單獨(dú)地處理闲延,直到最終生成scRNA-seq文庫(kù)痊剖。但是,此系統(tǒng)可以讓研究者們研究可變剪接與等位基因特異性表達(dá)垒玲。
非全長(zhǎng)系統(tǒng)則會(huì)從轉(zhuǎn)錄本的3’或5’末端生成序列陆馁,但這就限制了異構(gòu)體表達(dá)的分析,但是當(dāng)細(xì)胞cDNA合成被混合后合愈,細(xì)胞所加工的數(shù)量會(huì)比前一種高出2到3個(gè)數(shù)量級(jí)叮贩。單細(xì)胞測(cè)序?qū)挾扰c細(xì)胞,組織或樣本的數(shù)量有關(guān)佛析,而深度則是與測(cè)序讀長(zhǎng)數(shù)目固定下益老,要分析的轉(zhuǎn)錄組有關(guān)。雖然實(shí)驗(yàn)中測(cè)序的細(xì)胞數(shù)量是由選擇的方法決定的寸莫,但是這也允許一些靈活性捺萌,不過(guò)隨著分析的細(xì)胞數(shù)目的增多,測(cè)序成本的增加膘茎,往往限制了轉(zhuǎn)錄組分析的深度桃纯。因此,可以使用寬度和深度兩個(gè)維度來(lái)評(píng)估不同的scRNA-seq系統(tǒng)披坏。
單細(xì)胞測(cè)序典型的做法是基于孔板或微流控方法來(lái)捕獲盡量少的細(xì)胞慈参,但同時(shí)對(duì)每個(gè)細(xì)胞檢測(cè)出更多的基因,而基于液滴的系統(tǒng)可以用于分析最大數(shù)目的細(xì)胞刮萌,它已經(jīng)能從超過(guò)一百萬(wàn)個(gè)細(xì)胞中產(chǎn)生單獨(dú)的數(shù)據(jù)集驮配。
scRNA-seq的力量正在推動(dòng)著大規(guī)模的細(xì)胞圖譜項(xiàng)目,這些項(xiàng)目指在確定生物體或組織中完整的細(xì)胞類(lèi)型。人類(lèi)細(xì)胞地圖集(Human Cell Atlas)與NIH大腦計(jì)劃(NIH Brain Initiative)項(xiàng)目分別是為了對(duì)人體以及大腦中的所有細(xì)胞類(lèi)型進(jìn)行測(cè)序壮锻。人類(lèi)細(xì)胞地圖集的第1階段目標(biāo)是對(duì)3000萬(wàn)到1億個(gè)細(xì)胞進(jìn)行測(cè)序琐旁,并將隨著技術(shù)的發(fā)展在廣度和深度上進(jìn)行增加。這個(gè)項(xiàng)目的最新成本包括發(fā)現(xiàn)了離子細(xì)胞猜绣,以及發(fā)現(xiàn)腎癌是在兒童和成年人中是由不同的細(xì)胞類(lèi)型發(fā)展而來(lái)的灰殴。不過(guò),scRNA-seq的研究者們應(yīng)該意識(shí)到掰邢,這些技術(shù)可以用于幾乎所有的生物牺陶。最近,對(duì)A. thaliana根細(xì)胞原生質(zhì)的分析表明辣之,即使是植物的堅(jiān)韌細(xì)胞壁這種障礙也能被解決掰伸,能產(chǎn)生用于測(cè)序的單細(xì)胞。scRNA-seq正在迅速成為生物學(xué)家們工具包的標(biāo)準(zhǔn)配置怀估,并有可能在10年后被廣泛使用狮鸭,就像今天的常規(guī)RNA-seq一樣。
空間分辨RNA-seq法
當(dāng)前的常規(guī)RNA-seq和scRNA-seq方法為研究者們提供了關(guān)于組織或細(xì)胞群體的高度詳細(xì)的數(shù)據(jù)多搀,但是沒(méi)有捕獲空間信息歧蕉,就是會(huì)降低細(xì)胞環(huán)境與基因表達(dá)之間關(guān)系的分析能力。
空間轉(zhuǎn)錄組學(xué)(spatialomics)的兩種方法是空間編碼(spatial encoding)與原位轉(zhuǎn)錄組學(xué)(in situ transcriptomics)康铭。
在RNA-seq文庫(kù)制備過(guò)重中惯退,空間編碼方法能夠記錄其空間信息,或者是通過(guò)分離空間受限的細(xì)胞(例如从藤,通過(guò)激光捕獲顯微解剖蒸痹, laser-capture micro-dissection, LCM), 或者是通過(guò)分離前的位置對(duì)RNA加上條形碼(通過(guò)從組織切片中直接捕獲mRNA)(FIG. 3b)呛哟。原位轉(zhuǎn)錄組學(xué)能夠在組織切片中叠荠,通過(guò)對(duì)細(xì)胞中的RNA進(jìn)行測(cè)序或成像來(lái)生成數(shù)據(jù)。我們建議感興趣的讀者是閱讀最近的深度評(píng)論扫责,從而對(duì)這一領(lǐng)域進(jìn)行更全面的理解榛鼎。
LCM已經(jīng)成功地用于從組織切片中的特定區(qū)域分離和分析單個(gè)細(xì)胞用于RNA-seq。雖然LCM需要專(zhuān)門(mén)的設(shè)備鳖孤,但是許多機(jī)構(gòu)已經(jīng)廣泛使用了這種技術(shù)者娱。但是,雖然這種技術(shù)可能實(shí)現(xiàn)高度空間分辨率苏揣,但是它消耗人力黄鳍,并且難以批量使用。
使用空間轉(zhuǎn)錄學(xué) (Spatial Transcriptomics平匈,10X Genomics)與Slide-seq方法可以直接從冰凍組織切片中直接捕獲mRNAs框沟,然后將這些mRNAs直接加載到寡核苷酸微陣列玻片(oligo- arrayed microarray slides)或嚴(yán)密包裝寡核苷酸的pucks上藏古。寡核苷酸包括空間條形碼、UMI和oligo-dT引物忍燥,它們能唯一地識(shí)別每個(gè)轉(zhuǎn)錄本及其位置拧晕。測(cè)序讀長(zhǎng)被回貼到玻片的坐標(biāo)上,用于生成空間基因表達(dá)信息梅垄。空間轉(zhuǎn)錄學(xué)方法已經(jīng)被證明能夠在一系列物種的組織中能發(fā)揮作用厂捞,其中就包括小鼠大腦和人類(lèi)乳腺癌組織,人類(lèi)心臟組織和擬南芥(A. thaliana)花序組織队丝。
Slide- seq是最近開(kāi)發(fā)的一種技術(shù)靡馁,它已經(jīng)被證明能夠?qū)π∈蟠竽X的冰凍切片進(jìn)行測(cè)序。這些直接 mRNA捕獲方法并不需要特殊的設(shè)備机久,且有相對(duì)簡(jiǎn)單的分析方法臭墨,并有可能大規(guī)模地應(yīng)用于許多組織。然而吞加,還有兩個(gè)局限需要解決。
首先尽狠,該技術(shù)只能應(yīng)用于新鮮的冷凍組織衔憨。其次,分辨率受到到陣列大小和捕獲寡核苷酸點(diǎn)和珠子的間距的限制袄膏;目前的分析只能使用6.5x7 mm和3x3mm這兩種規(guī)格践图,這就限制了組織切片的尺寸〕凉荩空間轉(zhuǎn)錄組學(xué)斑點(diǎn)的直徑為100μm码党,間距為100μm,這意味著它們不夠小或不夠密集斥黑,無(wú)法實(shí)現(xiàn)單細(xì)胞級(jí)分辨率揖盘。Slide- seq珠子則要小的多,直徑只有10μm锌奴,而且非常密集兽狭,比相對(duì)前者具有十倍的空間分辨率,并且測(cè)序中的大約一半的珠子似乎是從單個(gè)細(xì)胞層面產(chǎn)生的數(shù)據(jù)鹿蜀。從分解的組織和空間編碼的數(shù)據(jù)與scRNA-seq混合起來(lái)的計(jì)算方法可以改善分辨率箕慧,但是需要基礎(chǔ)技術(shù)的進(jìn)一步發(fā)展,以使其成為更常規(guī)的RNA-seq工具茴恰。
上述空間分辨RNA-seq方法的替代方案包括原位測(cè)序和使用單分子熒光原位雜交的基于成像的方法颠焦。這些方法能夠產(chǎn)生比RNA-seq方法更窄的轉(zhuǎn)錄組信息,但它們能直接檢測(cè)RNA往枣,并且能夠?qū)Φ拓S度的轉(zhuǎn)錄本進(jìn)行分析伐庭。同時(shí)粉渠,它們還能提供組組織結(jié)構(gòu)和微環(huán)境的信息,并能產(chǎn)生亞細(xì)胞數(shù)據(jù)似忧。這種方法目前正取得了巨大進(jìn)步渣叛,但是成像方法的一個(gè)主要局限就是需要高分辨率或超分辨率顯微鏡與自動(dòng)流體技術(shù)結(jié)合,并且這種技術(shù)的成像時(shí)間可能要花上數(shù)小時(shí)盯捌,甚至是幾天淳衙。測(cè)序成本的下降比摩爾定律預(yù)測(cè)的速度更快,與測(cè)序成本相比饺著,高通量成規(guī)模的成像系統(tǒng)的機(jī)會(huì)似乎更有限箫攀。
上述提到的空間轉(zhuǎn)錄組學(xué)都受到無(wú)法產(chǎn)生深度轉(zhuǎn)錄組學(xué)數(shù)據(jù)的限制,以及受到細(xì)胞分辨率和/或高成本(時(shí)間和/或資金)的限制幼衰,但是這些方法正在迅速改進(jìn)靴跛,并且已經(jīng)應(yīng)用于臨床樣本《上空間轉(zhuǎn)錄組學(xué)的具體計(jì)算方法開(kāi)始出現(xiàn)梢睛。此外,原位RNA測(cè)序和成像方法的進(jìn)步已經(jīng)使得10E3到10E5個(gè)細(xì)胞生成的轉(zhuǎn)錄組數(shù)據(jù)成為可能识椰,這與基于液滴的單細(xì)胞方法獲得的數(shù)據(jù)量相近绝葡。未來(lái)的發(fā)展有可能使得空間轉(zhuǎn)錄組學(xué)讓更普通的研究者們使用。然而腹鹉,大多數(shù)的研究們者并不太可能需要真正的單細(xì)胞或亞細(xì)胞級(jí)分辨率藏畅。因此,轉(zhuǎn)錄組表達(dá)譜的寬度和對(duì)廣泛的組織或樣本的應(yīng)用性可能會(huì)推動(dòng)這些技術(shù)在特定小眾領(lǐng)域被采用功咒。如果空間轉(zhuǎn)錄組學(xué)的這些技術(shù)限制能夠被解決愉阎,那么它才有可能被廣泛使用。
動(dòng)態(tài)RNA-seq分析(Beyond steady-state RNA analysis)
DGE分析是使用RNA-seq來(lái)檢測(cè)穩(wěn)態(tài)下的mRNA表達(dá)水平力奋,這一表達(dá)水平是通過(guò)mRNA的轉(zhuǎn)錄榜旦,加工和降解速度來(lái)決定的。但是景殷,RNA-seq也可以用于研究涉及轉(zhuǎn)錄章办,翻譯所涉及的過(guò)程與動(dòng)力學(xué)特征,這些研究為基因表達(dá)提供了新的思路滨彻。
使用新生RNA(nascent RNA)方法來(lái)研究活性轉(zhuǎn)錄
基因表達(dá)是一個(gè)內(nèi)在的動(dòng)態(tài)過(guò)程藕届,但是在檢測(cè)復(fù)雜轉(zhuǎn)錄應(yīng)答的細(xì)微以及快速變化或確定不穩(wěn)定的非編碼RNAs,例如增強(qiáng)子RNAs方面亭饵,常規(guī)的DGE分析方法就比較受限休偶。RNA-seq可以用于繪制TSSs以及定量新合成的新生RNA,這就可以用來(lái)研究RNA動(dòng)力學(xué)辜羊。但是踏兜,與DGE分析相比词顾,nascent RNA的分析則比較難,因?yàn)樗鼈儼胨テ诙碳钭保S度低肉盹。因此,為了研究這些動(dòng)態(tài)的重要性疹尾,研究者們就開(kāi)發(fā)了多種方法來(lái)分析nascent RNA上忍;這些方法揭示了在啟動(dòng)子處的差異轉(zhuǎn)錄程度,表明RNA聚合酶II(Pol II)在啟動(dòng)子附近的暫停是基因表達(dá)的關(guān)鍵調(diào)節(jié)步驟纳本,證明了nascent RNA有直接調(diào)節(jié)轉(zhuǎn)錄的作用窍蓝,并表明其序列和結(jié)構(gòu)影響轉(zhuǎn)錄的延伸,暫停和停頓繁成,以及發(fā)揮染色體修飾結(jié)合和增強(qiáng)了子的作用吓笙。nascent RNA- seq方法旨在區(qū)分新近轉(zhuǎn)錄的RNA和其它RNAs,這些方法可以分為3類(lèi):run-on方法巾腕,Pol II免疫沉淀法面睛,代謝標(biāo)記法(FIG. 4)。
Figure4-nascent RNA與翻譯組分析的關(guān)鍵概念
Figure 4- nascent RNA與翻譯組分析的關(guān)鍵概念尊搬。nascent RNA分析方法是將那些在一個(gè)細(xì)胞中新轉(zhuǎn)錄的RNAs從其它的RNAs中富集出來(lái)叁鉴,并將它們與未富集的RNA(成熟的RNA)進(jìn)行比較,富集nascent RNAs的方法主要有三種毁嗦。(a)Run-on方法是利用一個(gè)限時(shí)脈沖的方法將修飾過(guò)的核糖核酸添加到細(xì)胞培養(yǎng)基中亲茅,對(duì)細(xì)胞的RNA進(jìn)行標(biāo)記回铛;這一過(guò)程可以用使用各種修飾的核苷酸狗准,但是,圖中的GRO-seq使用的是Bru修飾的核苷酸茵肃。當(dāng)修飾過(guò)的核苷酸整合到RNA后腔长,利用抗BrU的抗體,通過(guò)IP的手段將nascent-RNA鏈富集起來(lái)验残,并用于文庫(kù)制備以及測(cè)序分析捞附。(b)RNA聚合酶II(Pol II)的IP方法則是利用了微球菌核酸酶(micrococcal nuclease)消化了染色質(zhì)后,使用相應(yīng)的抗體拉下了與Pol II結(jié)合的RNA您没。在染色質(zhì)消化過(guò)程中鸟召,nascent RNA通過(guò)其Pol II足跡保護(hù)而不受核酸酶活性的影響,并不會(huì)被降解氨鹏。(c)代謝標(biāo)記方法標(biāo)記RNA的方法類(lèi)似于Run-on方法欧募,但前者使用的是核苷酸類(lèi)似物4 sU。提取RNA后仆抵,烷基化4 sU跟继,在逆轉(zhuǎn)錄過(guò)重中种冬,就會(huì)產(chǎn)生G核苷酸的錯(cuò)配,從而通過(guò)在堿基對(duì)級(jí)分辨率的突變分析中直接確定4 sU的整合位點(diǎn)舔糖。制備3’末端RNA文庫(kù)會(huì)通過(guò)降低未標(biāo)記的RNA數(shù)量來(lái)增加測(cè)序過(guò)程中的信號(hào)強(qiáng)度娱两。圖片參考文獻(xiàn)為214。
Run-on法是將核酸類(lèi)似物添加到樣品中金吗,從而使nascent RNA能夠從總的RNA混合物中進(jìn)行富集十兢,并能夠檢測(cè)瞬時(shí)RNA的轉(zhuǎn)錄(FIG. 4a)。全局run-on測(cè)序(Global run-on sequencing, GRO-seq)與精確核酸run-on測(cè)序(Precision nuclear run-on sequencing, PRO-seq)是分別將Bru或生物素修飾的核酸在RNA的轉(zhuǎn)錄期整合到nascent RNA中來(lái)實(shí)現(xiàn)的辽聊。其過(guò)程大致為纪挎,分離細(xì)胞核,并通過(guò)洗滌除去內(nèi)源性核苷酸跟匆,再添加外源生物素標(biāo)記的核苷酸异袄,隨后恢復(fù)轉(zhuǎn)錄。通過(guò)免疫沉淀或親和純化的方法玛臂,對(duì)富集的新轉(zhuǎn)錄RNA進(jìn)行測(cè)序烤蜕,從而檢測(cè)參與轉(zhuǎn)錄的RNA聚合酶的位置和活性。由于run-on過(guò)程中標(biāo)記的核苷酸的數(shù)據(jù)迹冤,GRO-seq只能測(cè)到10-50bp的長(zhǎng)度讽营,這就降低的TSS檢測(cè)的精度。PRO-seq能夠?qū)崿F(xiàn)單個(gè)堿基級(jí)的分辨率泡徙,因?yàn)樯锼貥?biāo)記的核苷酸摻入后轉(zhuǎn)錄就停止橱鹏,可以識(shí)別出轉(zhuǎn)錄位點(diǎn)。Run-on方法理解起來(lái)很簡(jiǎn)單堪藐,就是RNA分子整合了修飾的核苷酸莉兰,并對(duì)其進(jìn)行富集,用于測(cè)序礁竞,但是在實(shí)踐中糖荒,背景中存在有non-nascent RNA,這就需要增加讀長(zhǎng)深度模捂。利用這些方法捶朵,提示了啟動(dòng)子處,啟動(dòng)子處差異或雙向轉(zhuǎn)錄本起始的程度狂男,確定了增強(qiáng)子RNA在調(diào)節(jié)基因表達(dá)方面的作用综看。通過(guò)特定富集5’加帽的RNAs,GRO-cap岖食,PRO-cap或small 5’capped RNA測(cè)序(small 5?-capped RNA sequencing, START-seq)增加了檢測(cè)轉(zhuǎn)錄起始和捕獲RNAs的靈敏度和特異性红碑,這種處理還會(huì)降低源于轉(zhuǎn)錄后加帽的RNAs的背景信號(hào)。
Pol II的免疫共沉淀方法包括县耽,天然延長(zhǎng)轉(zhuǎn)錄測(cè)序(native elongating transcription sequencing, NET-seq)和哺乳動(dòng)物染色質(zhì)天然轉(zhuǎn)錄測(cè)序法(native elongating transcript sequencing for mammalian chromatin, mNET-seq)句喷,使用抗FLAG(用FLAG標(biāo)記的Pol II)抗體進(jìn)行沉淀的方法镣典,或各種針對(duì)Pol II C末端結(jié)構(gòu)域(CTD)的沉淀方法(FIG. 4b)。與這些染色質(zhì)復(fù)合物結(jié)合的nascent RNA的RNA-seq方法用于檢測(cè)TSSs唾琼,雖然non-nascent Pol II結(jié)合的RNA與背景mRNA會(huì)對(duì)讀長(zhǎng)濃度產(chǎn)生負(fù)面影響兄春,影響分析。NET-seq缺乏特異性锡溯,因?yàn)槿魏闻cPol II強(qiáng)烈結(jié)合的RNA都會(huì)污染nascent RNA的富集效果赶舆,例如在NET-seq數(shù)據(jù)中就存在有tRNA和small nucleolar RNA。在mNRET-seq中使用多個(gè)CTD抗體提示了VTD修飾是如何影響轉(zhuǎn)錄的祭饭,檢測(cè)到了RNA加工的中間體芜茵,并能能夠?qū)⑻囟ǖ腜ol II nascent RNAs定位于TSSs。然而倡蝙,這些檢測(cè)能力是以更復(fù)雜的實(shí)驗(yàn)九串,更多的細(xì)胞數(shù)量和更高的測(cè)序成本為代價(jià)的。
使用核苷酸類(lèi)似物硫代吡啶(4-thiouridine, 4 sU)進(jìn)行代謝脈沖標(biāo)記(Metabolic pulse- labelling)的方法可以識(shí)別nascent RNA(FIG. 4c)寺鸥。但是猪钮,在那些需要長(zhǎng)標(biāo)記時(shí)間的方法中,大多數(shù)的轉(zhuǎn)錄本都會(huì)被標(biāo)記胆建,這就限制了這種方法的靈敏度烤低。通過(guò)專(zhuān)門(mén)針對(duì)RNAs的3’末端(僅最近拉RNA聚合酶的新轉(zhuǎn)錄的RNA)的方法,瞬時(shí)轉(zhuǎn)錄組測(cè)序(transient transcriptome sequence, TT-seq)與硫醇(SH, thiol)連接的烷基化RNA代謝測(cè)序(thiol(SH)-linked alkylation for metabolic sequencing of RNA笆载, SLAM-seq)能夠降低來(lái)源于5’RNA的信號(hào)扑馁。TT-seq將標(biāo)記時(shí)間限制在5分鐘,因此只標(biāo)記新轉(zhuǎn)錄本的3’末端凉驻,它在進(jìn)行生物素親和純化前腻要,有一個(gè)RNA片段化操作,用于富集標(biāo)記的RNA沿侈。SLAM-seq整合了3’mRNA-seq文庫(kù)制備方法(雖然它也用于其它的文庫(kù)制備闯第,例如miRNA)市栗, 它僅針對(duì)標(biāo)記的新轉(zhuǎn)錄的RNA進(jìn)行測(cè)序缀拭,而非整個(gè)轉(zhuǎn)錄本進(jìn)行測(cè)序。此外填帽,在SLAM-seq中蛛淋,提取RNA后,還要加入碘乙酰胺(iodoacetamide)篡腌,用于烷基化已經(jīng)插入到新生成的nascent RNA鏈中的4 sU殘基褐荷。這種修飾會(huì)誘導(dǎo)反轉(zhuǎn)錄式依賴(lài)的胞腺嘧啶到胞嘧啶的轉(zhuǎn)換(T > C),這在測(cè)序分析中會(huì)被檢測(cè)為“突變”嘹悼,從而直接識(shí)別為4 su整合位點(diǎn)叛甫。然而层宫,低摻入率意味著只有少量的4 sU位點(diǎn)可以被轉(zhuǎn)換為胞嘧啶,這就限制了靈敏性其监。有兩種方法萌腿,即TUC-seq與TimeLapse-seq也使用T>C這種突變分析方法,但是它們并不富集3’末端抖苦。這兩種方法用于研究細(xì)胞干擾后的轉(zhuǎn)錄應(yīng)答和RNA的半衰期毁菱。
Nascent RNA分析方法還未進(jìn)行過(guò)直接比較。Nascent RNA方法都受到非特異性背景和/或降解的RNA的負(fù)面影響锌历,這會(huì)影響讀取深度贮庞。通過(guò)僅測(cè)序3’末端,那么non-nascent RNA的效應(yīng)就會(huì)在PRO-seq究西,TT-seq和SLAM-seq中降低窗慎,但是幾乎沒(méi)有證據(jù)表明是否有其他方法更優(yōu)。親和純化方法費(fèi)時(shí)費(fèi)力卤材,與代謝標(biāo)記法相比捉邢,前者需要更多的起始材料,但是商膊,確定脈沖標(biāo)記的時(shí)間比較復(fù)雜伏伐,并且短脈沖產(chǎn)生用于分析的RNA很少,這限制了靈敏度晕拆。最近開(kāi)發(fā)的藐翎,組織特異性RNA標(biāo)記方法以及親折突變分析計(jì)算方法或許能夠促進(jìn)研究者轉(zhuǎn)向使用生化(基于生物素)富集的手段來(lái)研究富含生物學(xué)意義的nascent RNA和其它RNA。Nascent RNA方法以及它們與其它方法的隧和实幕,例如空間轉(zhuǎn)錄組學(xué)或RNA-RNA與RNA-蛋白質(zhì)相互作用的方法吝镣,將會(huì)提高我們對(duì)轉(zhuǎn)錄過(guò)程的理解。
使用核糖體分析方法檢測(cè)活躍的翻譯
RNA-seq的主要用途在于研究樣本中的mRNA的種類(lèi)與數(shù)量昆庇,但是mRNAs的存在與否并不直接關(guān)系到蛋白質(zhì)的合成∧┘郑現(xiàn)在有兩種方法可以研究轉(zhuǎn)錄以外的翻譯情況,可以讓研究者們更好的理解翻譯組(translatome):一種是多核糖體表達(dá)譜(polysomal profiling)整吆,一個(gè)是核糖體足跡RNA-seq(Ribo-seq)拱撵。核糖體對(duì)mRNAs的翻譯具有高度的調(diào)節(jié)作用,蛋白質(zhì)水平主要由翻譯活性決定表蝙。多核糖體表達(dá)譜與Ribo-seq可以讓研究者探索一個(gè)轉(zhuǎn)錄本占用多少個(gè)核糖體以及核糖體在轉(zhuǎn)錄本上的分布(FIG. 5)拴测。這種方法可以讓研究者推斷在特定時(shí)間或細(xì)胞狀態(tài)下哪些轉(zhuǎn)錄本正在被活躍地翻譯。這兩種方法都假設(shè)mRNA 核糖體的密度與蛋白質(zhì)合成的水平相關(guān)府蛇。在不同樣本之間進(jìn)行比較集索,就能提示治療條件下,時(shí)間推移以及疾病發(fā)展過(guò)程中,核糖體的動(dòng)力學(xué)特征务荆,上述的這些情況都與翻譯的異常調(diào)控有關(guān)妆距,例如纖維化,朊病毒或癌癥函匕。
Figure 5-翻譯組的關(guān)鍵概念毅厚。翻譯組方法是從那些與核糖體結(jié)合的RNA中生成RNA-seq數(shù)據(jù),這種方法假設(shè)mRNA上的核糖體的密度與蛋白質(zhì)的合成水平相關(guān)浦箱。(a)多核糖體表達(dá)譜的方法是通過(guò)離心將RNA分子分成多核糖組分吸耿,然后通過(guò)RNA-seq的方法進(jìn)行比較。在多核糖體組分中表達(dá)較高的RNA被認(rèn)為是更活躍的轉(zhuǎn)錄酷窥。(b)核糖體足跡(Ribo-seq)法使用RNase來(lái)降解暴露的RNA咽安,同時(shí)保留那些被核糖體保護(hù)的未被降解的RNA。通過(guò)對(duì)這些保護(hù)的RNA進(jìn)行測(cè)序蓬推,就可以揭示出核糖體的密度與位置妆棒。通過(guò)修改變標(biāo)準(zhǔn)Ribo-seq方法,定量翻譯起始測(cè)序(QTI-seq)或翻譯復(fù)雜表達(dá)譜測(cè)序(TCP-seq)可以專(zhuān)門(mén)富集起始核糖體或其亞基沸伏,同時(shí)剔除延長(zhǎng)的核糖體糕珊,因此可以對(duì)翻譯的動(dòng)態(tài)過(guò)程進(jìn)行更詳細(xì)的分析。對(duì)翻譯組RNA-seq數(shù)據(jù)的過(guò)計(jì)算 分析可能確定每個(gè)mRAN的相對(duì)翻譯程度毅糟,可以研究翻譯的起始红选,延長(zhǎng)與終止的動(dòng)力學(xué)過(guò)程。
在多核糖體表達(dá)譜實(shí)驗(yàn)中姆另,使用蔗糖梯度超離心將與多個(gè)核糖體(多核糖體組分)結(jié)合的mRNA和與單個(gè)核糖體結(jié)合的mRNA(單核糖體組分)分離開(kāi)來(lái)喇肋,前者用于RNA seq文庫(kù)制備(FIG. 5a)。與單核糖體組分中檢測(cè)到的mRNA相比迹辐,在多核糖體組織中檢測(cè)到的高豐度mRNAs可以被認(rèn)為翻譯得更頻繁蝶防。這種方法也可以用于推測(cè)單個(gè)mRNAs的翻譯狀態(tài),也可以用于生成高分辨率的核糖體占有信息與密度(盡管它無(wú)法確定核糖體的位置)明吩。這類(lèi)方法的原始方法已經(jīng)進(jìn)行了幾項(xiàng)改進(jìn)间学。例如,使用非線(xiàn)性蔗糖梯度改善了多核糖體收集印荔,使多核糖體在不同濃度蔗糖溶液界面的收集過(guò)程更為簡(jiǎn)單低葫,使用Smart-seq文庫(kù)構(gòu)建技術(shù)可以讓研究者們分析僅10ng級(jí)的多核糖體mRNA,使用更高分辨率的蔗糖梯度和深度測(cè)序可以檢測(cè)了轉(zhuǎn)錄本異構(gòu)體的特異性翻譯躏鱼。然而氮采,多核糖體表達(dá)譜實(shí)驗(yàn)生成的翻譯組信息分辨率相對(duì)低殷绍,這一過(guò)程還比較費(fèi)力染苛,需要特殊的儀器,這就限制了其應(yīng)用范圍。
Ribo-seq是基于RNA足跡的方法茶行,它最初用于酵母研究躯概。這種方法用環(huán)己胺(cyclohexamide)來(lái)抑制翻譯延伸,并誘導(dǎo)核糖體在mRNAs上停滯畔师。用RNase I消化mRNA會(huì)留下20-30個(gè)核苷酸娶靡,這20-30個(gè)核苷酸就是受核糖體保護(hù)的足跡,這些足跡被處理后用于制備RNA-seq文庫(kù)(FIG. 5b)看锉。Ribo-seq能生成高分辨率的翻譯譜姿锭,描繪核糖體豐度和單個(gè)轉(zhuǎn)錄本的位置。而多核糖體分析中無(wú)法提供核糖體的位置信息時(shí)伯铣,這說(shuō)明有可能檢測(cè)到了翻譯的暫停呻此,這些檢查可以調(diào)節(jié)蛋白質(zhì)的表達(dá)。當(dāng)方法修改了緩沖液和對(duì)酶進(jìn)行了優(yōu)化后腔寡,就能更清楚地揭示Ribo-seq數(shù)據(jù)中3-bp的周期性焚鲜,以及條形碼和UMIs(檢測(cè)單個(gè)分子的事件)。標(biāo)準(zhǔn)的RNA-seq工具可以用于Ribo-seq的計(jì)算分析放前,但最近已經(jīng)出現(xiàn)了特定的工具用于尋找開(kāi)放閱讀框忿磅,用于差異或異構(gòu)體水平的翻譯分析,以及用于研究密碼子偏倚凭语。Ribo-seq的主要限制就是超速離心葱她,以及由于核酸酶不同批次間的變化,以需要經(jīng)驗(yàn)來(lái)確定RNase I的消化條件似扔。
這些方法檢測(cè)的是來(lái)自翻譯起始览效、延伸和終止的信號(hào)的平均強(qiáng)度,但是對(duì)Ribo-seq的修改可使得其能夠研究翻譯動(dòng)力學(xué)虫几。定量翻譯起始測(cè)序(Quantitative translation initiation sequencing, QTI-seq)通過(guò)化學(xué)“冷凍”和富集起始核糖體锤灿,同時(shí)從結(jié)合的mRNA中去除延長(zhǎng)的核糖體來(lái)定位轉(zhuǎn)錄起始位點(diǎn)。翻譯復(fù)雜譜測(cè)序(Translation complex profile sequencing, TCP-seq)也通過(guò)在組裝成熟核糖體之前富集與40S核糖體小亞基結(jié)合的RNA來(lái)檢測(cè)起始位點(diǎn)辆脸。然而但校,由于這種方法中保留了核糖體的完整性,也可以分析和比較80S核糖體組分啡氢,從而更全面檢測(cè)翻譯動(dòng)力學(xué)(FIG. 5b)状囱。
所有的翻譯組方法在概念上都是相似的;它們假設(shè)mRNA核糖體的密度與蛋白質(zhì)的合成水平相關(guān)倘是。雖然它們的樣本制備方案不同亭枷,但都需要大量的起始細(xì)胞數(shù)。最終搀崭,翻譯組與RNA-seq結(jié)合起來(lái)研究基因的表達(dá)水平叨粘,并與蛋白質(zhì)組學(xué)一道來(lái)研究蛋白水平猾编,這可能就需要對(duì)mRNA的翻譯進(jìn)行一個(gè)廣泛地理解。如果想要了解翻譯組的更詳細(xì)信息升敲,可以閱讀最近的綜述答倡。
RNA結(jié)構(gòu)與相互作用分析(Beyond analysis of gene expression)
RNAs在調(diào)節(jié)其它生物分子和生物過(guò)程(例如剪接和翻譯)中發(fā)揮著重要作用,它們涉及RNA與各種蛋白質(zhì)和/或其它RNA分子的相互作用驴党。RNA-seq可以用于研究分子內(nèi)和分子間RNA-RNA的相互作用(RNA-RNA interactions, RRIs)瘪撇,這可能讓研究者更好地理解結(jié)構(gòu)組(structurome),或者是研究RNA與蛋白質(zhì)之間的相互作用港庄,這樣就可以深入理解轉(zhuǎn)錄與翻譯(FIG. 6)倔既。針對(duì)相互作用組(interactome)分析而開(kāi)發(fā)的各種方法都有一個(gè)共同的主題:在RNA中富集出那些與其它RNA有相互作用的RNA。一些方法利用的是天然生物學(xué)相互作用鹏氧,而其它的方法則是在目標(biāo)分子之間計(jì)算瞬時(shí)作用力或共價(jià)鍵叉存;大多數(shù)方法使用的是抗體pull-dwon、親和純化或探針雜交的手段來(lái)富集RNA進(jìn)行測(cè)序度帮。在這里我們簡(jiǎn)要描述一下主要的基于RNA-seq的方法來(lái)研究結(jié)構(gòu)組和相互作用體的內(nèi)容歼捏。
Figure6—RNA結(jié)構(gòu)和RNA-蛋白質(zhì)相互作用分析的關(guān)鍵概念
Figure 6-RNA結(jié)構(gòu)和RNA-蛋白質(zhì)相互作用分析的關(guān)鍵概念。(a)結(jié)構(gòu)組分析使用核酸酶或化學(xué)標(biāo)記試劑在全轉(zhuǎn)錄組范圍內(nèi)來(lái)研究結(jié)構(gòu)化RNA(例如雙鏈RNA笨篷,dsRNA)或非結(jié)構(gòu)化RNA(單鏈RNA瞳秽,ssRNA)。在大多數(shù)實(shí)驗(yàn)中率翅,在單獨(dú)的反應(yīng)中對(duì)ssRNA和dsRNA進(jìn)行檢測(cè)练俐,其結(jié)果聯(lián)合反應(yīng)性分析法來(lái)確定其結(jié)構(gòu)特征。核酸酶消化方法使用針對(duì)dsRNA和/或ssRNA的一個(gè)或多個(gè)核酸酶來(lái)研究RNA的結(jié)構(gòu)冕臭。例如腺晾,在對(duì)RNA結(jié)構(gòu)要的并行分析(PARS)中,在體外使用RNase V1(一種dsRNA特異性核酸酶)或S1核酸酶(一種ssRNA特異性核酸酶)來(lái)酶切并行樣本辜贵。酶解后剩余的RNA被轉(zhuǎn)化為cDNA悯蝉,然后進(jìn)行測(cè)序,測(cè)序的讀長(zhǎng)深度與比對(duì)區(qū)域的反應(yīng)性成正比托慨。RNA-seq數(shù)據(jù)的覆蓋和比較結(jié)果就能推斷RNA的結(jié)構(gòu)鼻由。化學(xué)分析法(Chemical-mapping methods)厚棵,例如使用引物延伸的選擇性2?-羥基踅妒溃化分析法(SHAPE-seq)或突變表達(dá)譜分析法(SHAPE-Map),這些方法通過(guò)結(jié)構(gòu)依賴(lài)形式在體外或體內(nèi)對(duì)雙鏈或單鏈區(qū)域的核糖核苷酸進(jìn)行修飾婆硬。標(biāo)記物可以阻斷逆轉(zhuǎn)錄狠轻,導(dǎo)致cDNAs的截短,或者是導(dǎo)致修飾位置錯(cuò)誤地?fù)饺胪蛔儽蚍浮NA被轉(zhuǎn)化為cDNA后進(jìn)行測(cè)序向楼,讀長(zhǎng)深度或突變率與比對(duì)區(qū)域的反應(yīng)性成正比查吊,從而推斷RNA的結(jié)構(gòu)。(b)RNA-RNA的相互作用分析方法蜜自,例如SPLASH菩貌,這種方法的第一步是將有相互作用的RNA分子通過(guò)生物素化的補(bǔ)骨脂進(jìn)行交聯(lián)卢佣,然后以通過(guò)鏈霉親和素對(duì)其進(jìn)行富集重荠,第二步是在鄰近位置加入相互作用RNA的自由端加入鄰近連接與及片段化。第三步是進(jìn)行RNA接頭的連接以及環(huán)化虚茶,制備RNA-seq文庫(kù)用于測(cè)序戈鲁,從而揭示出分子內(nèi)(也就是結(jié)構(gòu))的RNA相互作用以及分子間的相互作用位點(diǎn)。(c)RNA-蛋白質(zhì)相互作用方法嘹叫,例如RNA交聯(lián)免疫沉淀后測(cè)序(CLIP-seq)婆殿,這種方法使用UV輻射在相互作用的RNA和蛋白質(zhì)之間產(chǎn)生共價(jià)交聯(lián)。目的蛋白被抗體富集后罩扇,與此蛋白結(jié)合的RNA也就被富集了下來(lái)婆芦,這些RNA加上3’接頭后,提取出來(lái)用于cDNA的合成喂饥。從結(jié)合了接頭的RNA生成的cDNA用于文庫(kù)制備消约,測(cè)序。
通過(guò)研究RNA分子內(nèi)的相互作用來(lái)研究RNA的結(jié)構(gòu)
核糖體RNA和tRNA構(gòu)成細(xì)胞的大部分RNA员帮。它們與其他結(jié)構(gòu)非編碼RNA一起在細(xì)胞中發(fā)揮各種作用或粮,例如從基因調(diào)節(jié)到翻譯。現(xiàn)存主要有兩種研究RNA結(jié)構(gòu)的方法:基于核酸酶的方法和化學(xué)探針?lè)椒ɡ谈摺:颂呛怂崦赶?965年首次用于研究RAN(tRNA(Ala))的結(jié)構(gòu)氯材。在接下來(lái)的40年中發(fā)展了化學(xué)方法,例如硝岗,通過(guò)引物延伸的選擇性2?-羥基跚庀化法(selective 2?-hydroxyl acylation analysed by primer extension, SHAPE),此種方法用于在單堿基分率水平上檢測(cè)tRNA(Asp)的結(jié)構(gòu)型檀。但是命浴,只有將各種核酸酶法和化學(xué)方法與RNA-seq相結(jié)合,才能使方法從單一RNA轉(zhuǎn)移到全轉(zhuǎn)錄分析贱除,這正在改變我們對(duì)結(jié)構(gòu)復(fù)雜性和重要性的理解生闲。在這里,我們集中討論核酸酶和化學(xué)分析方法之間的主要區(qū)別(圖·6a)月幌,如果想對(duì)這方面有進(jìn)一步的理解碍讯,可以看Strobel在這方面的綜述。
核酸酶方法扯躺,例如RNA結(jié)構(gòu)的平行分析法(Parallel Analysis of RNA Structure捉兴,PARS)和片段測(cè)序法(fragmentation sequencing, FRAG-seq)蝎困,這兩種方法使用能消化單鏈RNA(ssRNA)或雙鏈RNA(dsRNA)的酶。核酸酶消化后剩余的RNA用作RNA-seq的文庫(kù)構(gòu)建倍啥。隨后通過(guò)對(duì)產(chǎn)生的RNA序列數(shù)據(jù)進(jìn)行計(jì)算分析來(lái)識(shí)別結(jié)構(gòu)化(雙鏈)和非結(jié)構(gòu)化(單鏈)區(qū)域禾乘。核酸酶易于使用,可以用于研究ssRNA和dsRNA虽缕,但是由于核酸酶消化法的隨機(jī)特性始藕,它們與化學(xué)分析法相比,分辨率比較低氮趋。此外伍派,由于核酸酶尺寸比較大,這就限制了這些核酸酶進(jìn)入細(xì)胞剩胁,這就使得它們不適合體內(nèi)研究诉植。
化學(xué)分析法使用與RNA分子反應(yīng)的化學(xué)探針,來(lái)標(biāo)記結(jié)構(gòu)化或非結(jié)構(gòu)化核苷酸昵观。這些標(biāo)記要么阻斷逆轉(zhuǎn)錄晾腔,要么導(dǎo)致cDNA的錯(cuò)配,從而可以定位并分析RNA-seq讀長(zhǎng)啊犬,用于揭示結(jié)構(gòu)組灼擂。SHAPE之后進(jìn)行測(cè)序,這種技術(shù)方法能夠RNA骨架上的核糖2’-羥基反應(yīng)來(lái)標(biāo)記未配對(duì)的ssRNA椒惨,雖然發(fā)夾環(huán)中的堿基折疊會(huì)降低其效率缤至。Structure-seq與硫酸二甲酯測(cè)序(dimethyl sulfate sequencing, DMS-seq)能使用DMS來(lái)標(biāo)記腺嘌呤和胞嘧啶殘基,阻斷逆轉(zhuǎn)錄康谆,最終從生成的截短cDNAs分析中推斷出RNA結(jié)構(gòu)领斥。SHAPE和突變表達(dá)譜(SHAPE and utational profiling, SHAPE-Map)和DMS突變表達(dá)譜測(cè)序(DMS-MaPseq)都修改了實(shí)驗(yàn)條件,從而提高了逆轉(zhuǎn)錄酶的加工能力沃暗,并防止cDNA截短月洛。相反,化學(xué)標(biāo)記會(huì)導(dǎo)致錯(cuò)配事件孽锥,在RNA-seq數(shù)據(jù)的分析中嚼黔,能夠檢測(cè)出這些“突變”娜膘,從而揭示RNA結(jié)構(gòu)嫩与。化學(xué)探針是小分子化合物宫补,盡管由于細(xì)胞內(nèi)的環(huán)境處于動(dòng)態(tài)變化中盛撑,數(shù)據(jù)有可能更加多變碎节,但是化學(xué)探針還是能夠用于研究活體內(nèi)的有生物學(xué)意義的結(jié)構(gòu)〉治溃化學(xué)探針還可以用于nascent RNAs的結(jié)構(gòu)分析狮荔,并揭示共轉(zhuǎn)錄RAN折疊的順序胎撇。
核酸酶和反轉(zhuǎn)錄阻斷方法通常產(chǎn)生短RNA片段,并且只報(bào)告單個(gè)酶切位點(diǎn)或化學(xué)標(biāo)記殖氏,而錯(cuò)誤結(jié)合和突變檢測(cè)方法可以報(bào)告每個(gè)讀長(zhǎng)的多個(gè)化學(xué)標(biāo)記晚树。沒(méi)有方法不存在偏倚;逆轉(zhuǎn)錄阻斷永遠(yuǎn)不會(huì)100%有效雅采,本應(yīng)誘導(dǎo)突變的化學(xué)標(biāo)記可以阻斷cDNA合成爵憎,這兩個(gè)因素都可以影響數(shù)據(jù)的解讀。Spike-in控制有可能改善結(jié)構(gòu)組分析的質(zhì)量总滩,但尚未得到廣泛使用纲堵。SHAPE方法的比較揭示了僅在體內(nèi)實(shí)驗(yàn)中才會(huì)出現(xiàn)效率差異巡雨,因此這就突顯出比較類(lèi)似復(fù)雜方法時(shí)所需要謹(jǐn)慎闰渔。
這些方法正在產(chǎn)生關(guān)于RNA結(jié)構(gòu)如何在基因和蛋白質(zhì)調(diào)控中發(fā)揮作用的新理解。例如铐望,DMS分析說(shuō)明了冈涧,RNA結(jié)構(gòu)有可能調(diào)控APA,或許會(huì)減慢催化活性區(qū)域的翻譯正蛙,使得更多的時(shí)間用于蛋白質(zhì)的折疊督弓,從而減少錯(cuò)誤折疊事件。結(jié)構(gòu)RNA-seq方法的結(jié)合有可能產(chǎn)生所有的完整結(jié)構(gòu)組信息乒验。隨著該領(lǐng)域的擴(kuò)展愚隧,我們可能會(huì)發(fā)現(xiàn),RNA的結(jié)構(gòu)與疾病的進(jìn)展和或疾病的狀態(tài)有關(guān)锻全;最近的結(jié)果表明狂塘,異常RNA結(jié)構(gòu)在重復(fù)擴(kuò)張性疾病方面可能發(fā)揮作用。最終鳄厌,結(jié)構(gòu)組分析也許會(huì)促進(jìn)那些靶向作用于研究透徹的RNA結(jié)構(gòu)的小分子的開(kāi)發(fā)荞胡,從而開(kāi)辟治療開(kāi)發(fā)的新領(lǐng)域。
研究分子間RNA-RNA相互作用
分子間的RRIs在轉(zhuǎn)錄后調(diào)控中發(fā)揮著重要作用了嚎,例如miRNA與靶基因的3’UTR結(jié)合±崞現(xiàn)在已經(jīng)開(kāi)發(fā)了用于研究分子間RRI的工具,它們用于靶向分析和轉(zhuǎn)錄組分析歪泳。這些分析方法含有一個(gè)共同的工作流程萝勤,即RNA在打斷與鄰位連接之前,通過(guò)交聯(lián)來(lái)保護(hù)其相互作用(FIG. 6b)呐伞。大多數(shù)并非全部敌卓,由不同方法嵌合生成的嵌合cDNA來(lái)源于穩(wěn)定堿基配對(duì)(即相互作用)RRNA分子的連接。靶向方法荸哟,例如交聯(lián)假哎,連接和雜交物測(cè)序(Crosslinking, ligation and sequencing ?of hybrids, CLASH)瞬捕, RNA相互作用組分析和測(cè)序(RNA interactome analysis and sequencing, RIA-seq)和RNA反義純化方法測(cè)序(RNA antisense purification followed by RNA sequencing, RAP-RNA)能產(chǎn)生一個(gè)RNA或RNA家族的高深度相互作用圖譜。CLASH豐富了使用IP來(lái)進(jìn)行特定蛋白復(fù)合物介導(dǎo)的RRI分析方法舵抹,而RIA-seq使用反應(yīng)寡核苷酸來(lái)回收那些與靶基因有相互作用的RNAs肪虎;這兩種方法都無(wú)法區(qū)分直接和間接的RRIs,這就導(dǎo)致其生物學(xué)解釋變得復(fù)雜惧蛹。為了提高RRI分析的分辨率扇救,RAP-RNA使用補(bǔ)骨脂素(psoralen)和其他交聯(lián)劑,然后用反義寡核苷酸捕獲RNA香嗓,以及使用高通量RNA-seq來(lái)檢測(cè)直接和間接RRI迅腔。雖然該方法可以進(jìn)行更具體的分析,它需要制備多個(gè)文庫(kù)(每個(gè)交聯(lián)劑一個(gè)文庫(kù))靠娱。
轉(zhuǎn)錄組方法從根本上類(lèi)似于靶向方法:相互作用的RNA在體外被交聯(lián)后并被富集沧烈。通過(guò)減少進(jìn)入連接反應(yīng)的非相互作用RNA的量來(lái)提高富集的特異性,并且可以通過(guò)2D凝膠純化(如在RNA相互作用和結(jié)構(gòu)的補(bǔ)骨脂素分析(psoralen analysis of RNA interactions and structures, PARIS)或交聯(lián)RNA的生物素親和純化(如在補(bǔ)骨脂素交聯(lián)像云,連接和選擇的雜交測(cè)序锌雀, sequencing of psoralen crosslinked, ligated and selected hybrids,SPLASH)來(lái)實(shí)現(xiàn),或者通過(guò)RNase R酶的消化來(lái)清除非交聯(lián)RNA(如在相互作用的RNA連接之后的RNA-seq, ligation of interacting RNA followed by RNA- seq迅诬, LIGR-seq)腋逆。連接后,在進(jìn)行RNA-seq文庫(kù)制備前侈贷,去除交聯(lián)惩歉,然后進(jìn)行測(cè)序。PARIS能夠生成所有方法中最高數(shù)目的相互作用次數(shù)俏蛮,但是每個(gè)樣本需要75M的讀長(zhǎng)撑蚌,這些任何其他的RRI方法都多,并且所需要的DGE實(shí)驗(yàn)平均讀長(zhǎng)深度是其他實(shí)驗(yàn)的2倍嫁蛇。
對(duì)整理好的RNA相互作用數(shù)據(jù)的分析可以對(duì)多個(gè)相互作用進(jìn)行可視化锨并,并些這種分析方法已經(jīng)提示了RNA各類(lèi)的RRI分布的變化〔桥铮總之第煮,90%的RRIs涉及mRNAs。近一半涉及miRNA或長(zhǎng)鏈非編碼RNA抑党,對(duì)于這些RNA包警,大多數(shù)相互作用都與mRNA靶基因相關(guān)。對(duì)這些整理數(shù)據(jù)的比較揭示了不同方法對(duì)特定RNA物種的偏倚底靠,這導(dǎo)致這些方法之間幾乎沒(méi)有重疊害晦。因此,繪制RRI的完整圖譜可能需要使用不止一種方法。然而壹瘟,RRI方法有幾個(gè)局限性鲫剿。也許最具挑戰(zhàn)性的就是RRI是動(dòng)態(tài)的,并受結(jié)構(gòu)構(gòu)象和其他分子間相互作用的影響稻轨,這使得在沒(méi)有重復(fù)的情況下灵莲,很難對(duì)其進(jìn)行解釋。分子內(nèi)的相互作用為分子間的RRI分析增加了干擾殴俱,這就需要過(guò)濾并除去那些高度結(jié)構(gòu)化的RNAs政冻,例如rRNAs。其它的問(wèn)題還包括RNA提取過(guò)程中相互相互作用的打斷线欲,這就需要穩(wěn)定的交聯(lián)方法明场,但最常用的RRI交聯(lián)劑是補(bǔ)骨脂素和4’-氨基-甲基三氧沙林(4?-amino- methyltrioxsalen, AMT),這些交聯(lián)劑只交聯(lián)嘧啶李丰,其效率比較低苦锨,會(huì)降低靈敏度。此外嫌套,鄰近連接步驟低效逆屡,并且這會(huì)連接相互作用和非相互作用RNA圾旨,進(jìn)一步降低靈敏度踱讨。
研究RNA-蛋白質(zhì)相互作用
ChIP-seq已經(jīng)成了繪制和研究DNA-蛋白質(zhì)相互作用不可或缺的工具;類(lèi)似的IP方法也用于研究RNA-蛋白質(zhì)的相互作用砍的。RNA-蛋白質(zhì)相互作用方法依賴(lài)于IP痹筛,利用針對(duì)感興趣的RNA結(jié)合蛋白的抗體來(lái)捕獲其結(jié)合的RNA進(jìn)行分析(第一次報(bào)道時(shí)是用芯片進(jìn)行分析的)(FIG. 6c)。
各種RNA-蛋白質(zhì)相互作用方法之間最明顯的區(qū)別在于相互作用的RNA和蛋白質(zhì)是否交聯(lián)以及如何交聯(lián):一些方法避免交聯(lián)(天然IP廓鞠, native IP)帚稠,其他方法使用甲醛進(jìn)行交聯(lián),一些方法使用紫外線(xiàn)(UV)光進(jìn)行交聯(lián)床佳。最簡(jiǎn)單的方法就是RNA免疫沉淀測(cè)序(RNA immunoprecipitation and sequencing, RIP-seq)滋早,時(shí)常,但并非所有情況下都使用天然IP法砌们,以及并非總進(jìn)行RNA打斷杆麸。這種簡(jiǎn)便性使用該方法易于被采用。這種方法能產(chǎn)生有用的生物學(xué)信息浪感,但是它有兩個(gè)重要的缺陷昔头。
第一,用于保存RNA-蛋白質(zhì)相互作用的前提是需要進(jìn)行溫和地洗滌影兽,這就意味著富集的片段中有相對(duì)高的非特異性結(jié)合片段揭斧。
第二,沒(méi)有進(jìn)行RNA打斷就降低了結(jié)合位點(diǎn)的分析峻堰。因此讹开,RIP-seq具有高度靈活性盅视,并依賴(lài)于RNA-蛋白質(zhì)結(jié)合的自然穩(wěn)定性。使用甲醛交聯(lián)在RNA與其相互作用的蛋白質(zhì)之間產(chǎn)生可逆的共價(jià)鍵提高了穩(wěn)定性旦万,并減少了非特異性RNA的回收左冬,但甲醛也會(huì)導(dǎo)致蛋白質(zhì)-蛋白質(zhì)的交聯(lián)。這種影響可以通過(guò)使用0.1%的甲醛(比ChIP-seq研究使用的甲醛低10倍)進(jìn)行溫和的交聯(lián)來(lái)降低纸型,這能在多個(gè)蛋白質(zhì)靶點(diǎn)上產(chǎn)生高質(zhì)量的結(jié)果拇砰。
在CLIP中使用254nm的UV來(lái)進(jìn)行聯(lián)系是一項(xiàng)關(guān)鍵的技術(shù),它提高了RNA-蛋白質(zhì)相互作用分析方法的特異性和位置分辨率狰腌。UV交聯(lián)在蛋白質(zhì)和RNA的相互作用位點(diǎn)產(chǎn)生共價(jià)鍵除破,但最重要的是,它不對(duì)蛋白質(zhì)-蛋白質(zhì)相互交聯(lián)琼腔。這就穩(wěn)定了RNA-蛋白質(zhì)的結(jié)合瑰枫,允許嚴(yán)格的富集,破壞了天然RNA-蛋白質(zhì)的相互作用丹莲,減少了背景信號(hào)光坝。CLIP的實(shí)驗(yàn)方法隨后就構(gòu)成了許多方法發(fā)展的基礎(chǔ)。單個(gè)核苷酸分辨率的CLIP(iCLIP)將UMIs整合到文庫(kù)中甥材,用于移除PCR復(fù)制盯另。它還利用了cDNA合成在交聯(lián)核苷酸處常見(jiàn)的過(guò)早截短,通過(guò)對(duì)截短的cDNA進(jìn)行擴(kuò)增來(lái)獲得交聯(lián)位點(diǎn)的定量洲赵,核苷酸級(jí)分辨率圖譜鸳惯。光激活核糖核苷增強(qiáng)片段(Photoactivatable- ribonucleotide-enhanced CLIP,PAR-CLIP)通過(guò)使用4 sU和356nM的UV來(lái)進(jìn)行交聯(lián)。在細(xì)胞培養(yǎng)過(guò)程中叠萍,4 sU被整合到內(nèi)源RNAs中芝发,356nm的UV輻射會(huì)在4 sU整合位點(diǎn)處產(chǎn)生交聯(lián)(產(chǎn)生高度的特異性)。在產(chǎn)生的測(cè)序數(shù)據(jù)中檢測(cè)反轉(zhuǎn)錄誘導(dǎo)的T>C替換就會(huì)能夠?qū)崿F(xiàn)堿基對(duì)級(jí)的分辨率苛谷,并且能夠區(qū)分交聯(lián)片段和非交聯(lián)片段辅鲸,進(jìn)一步降低背景信號(hào)。最近對(duì)CLIP的改進(jìn)提高了它的效應(yīng)和靈敏度腹殿。紅外CLIP(infrared CLIP, irCLIP)用紅外凝膠成像技術(shù)來(lái)代替放射性同位素檢驗(yàn)独悴,它是基于珠子的純化技術(shù)。與常規(guī)的iCLIP使用的1百萬(wàn)到2百萬(wàn)細(xì)胞相比赫蛇,這些技術(shù)的改進(jìn)可分析只有2萬(wàn)個(gè)細(xì)胞的RNA-蛋白質(zhì)相互作用绵患。增強(qiáng)型CLIP(enhanced CLIP, eCLIP)拋棄了RNA-蛋白質(zhì)復(fù)合物的質(zhì)控和可視化操作,而是在RNA接頭中添加了條形碼悟耘,這種改進(jìn)可能讓所有的樣本混合到一起落蝙,并用珠子來(lái)代替了凝膠。這些改進(jìn)旨在簡(jiǎn)化實(shí)驗(yàn)操作,eCLIP實(shí)驗(yàn)已經(jīng)研究了近200個(gè)蛋白筏勒,它已經(jīng)成了ENCODE項(xiàng)目的一部分移迫。但是,irCLIP與eCLIP目前都沒(méi)有被廣泛采用管行,部分原因是eCLIP和irCLIP的靈敏性增加的原因是由于其特異性降低導(dǎo)致的厨埋,比如利用兩個(gè)方法所鑒定的PTBP1結(jié)合位點(diǎn)上結(jié)合或有序和調(diào)節(jié)外顯子的富集減少。隨著公共數(shù)據(jù)庫(kù)中可用的大量數(shù)據(jù)為計(jì)算分析提供了新的機(jī)會(huì)捐顷,因此謹(jǐn)慎考慮CLIP數(shù)據(jù)的質(zhì)控荡陷,過(guò)濾,以及峰值調(diào)用(peak calling)和歸一化方法就變得非常重要迅涮,這些會(huì)影響數(shù)據(jù)的生物學(xué)解釋废赞。為了更全面地討論 RNA-蛋白質(zhì)的相互作用的CLIP實(shí)驗(yàn)方法,我們建議讀者可以閱讀最近關(guān)于這個(gè)主題的綜述叮姑。
一些RRI以及所有的RNA-蛋白質(zhì)結(jié)合方法對(duì)IP的依賴(lài)限制了其對(duì)有良好特征抗體蛋白質(zhì)的研究唉地,而非特異抗體的結(jié)合仍然是一個(gè)問(wèn)題(雖然這一問(wèn)題并非局限于這個(gè)領(lǐng)域)。RNA結(jié)構(gòu)也會(huì)影響RNA-蛋白質(zhì)之間的相互作用传透;一些蛋白質(zhì)能識(shí)別特異的RNA二級(jí)結(jié)構(gòu)或與這些結(jié)構(gòu)競(jìng)爭(zhēng)結(jié)合RNA耘沼,這使得體外的發(fā)現(xiàn)轉(zhuǎn)向體內(nèi)就變得復(fù)雜了。此外朱盐,結(jié)構(gòu)和RNA-蛋白質(zhì)相互作用方法通常報(bào)告一個(gè)特定轉(zhuǎn)錄本或位置的平均值群嗤。在實(shí)驗(yàn)室方法中,在計(jì)算方法和單分子測(cè)序方面的未來(lái)發(fā)展或許有助于破譯一些這些生物變異托享。
結(jié)論
Wang骚烧,Gerstein和Snyder關(guān)于RNA-seq將“革命性地[如何]分析真核轉(zhuǎn)錄體”的預(yù)測(cè)肯定是正確的。但是闰围,即使是他們,也有可能對(duì)這種轉(zhuǎn)型的規(guī)模感到驚訝〖认浚現(xiàn)在我們可以分析RNA生物學(xué)的許多方面羡榴,這對(duì)于基因組功能、研究開(kāi)發(fā)和確定導(dǎo)致癌癥和其他疾病的分子調(diào)控異常方面來(lái)說(shuō)是必不可少的运敢。雖然生物學(xué)發(fā)現(xiàn)階段還遠(yuǎn)未結(jié)束校仑,但是已經(jīng)在臨床中使用了RNA-seq方法。
單細(xì)胞測(cè)序正在成為許多實(shí)驗(yàn)的標(biāo)準(zhǔn)配置传惠,空間轉(zhuǎn)錄組學(xué)的分析可能會(huì)遵循類(lèi)似的路徑迄沫,使其能夠在與開(kāi)發(fā)當(dāng)前方法的實(shí)驗(yàn)室范圍之外使用。
長(zhǎng)讀長(zhǎng)測(cè)序方法也有可能取代當(dāng)前相當(dāng)大比例的研究者們默認(rèn)選擇的Illumina的短讀長(zhǎng)RNA-seq卦方。對(duì)于這種情況的出現(xiàn)羊瘩,長(zhǎng)讀長(zhǎng)測(cè)序技術(shù)還需要在增加通量和降低錯(cuò)誤率方面做出極大的改進(jìn)。然而,長(zhǎng)讀長(zhǎng)mRNA異構(gòu)體測(cè)序的優(yōu)點(diǎn)是尘吗,如果它變得像現(xiàn)在短讀長(zhǎng)測(cè)序一樣便宜和可靠逝她,那么對(duì)于那些除了易降解材料外,長(zhǎng)讀長(zhǎng)測(cè)序就可能是首選睬捶∏穑考慮到這些因素,那么任何關(guān)于RNA-seq在未來(lái)十年可能如何發(fā)展的預(yù)測(cè)都有可能過(guò)于保守擒贸。