作者:馬可菠蘿
審稿:童蒙
編輯:angelica
引言
隨著Hi-C技術(shù)的建立和發(fā)展亲桦,越來越多的技術(shù)可以用于DNA-DNA相互作用的研究坚弱,類似的RNA-RNA相互作用檢測技術(shù)業(yè)已誕生稍味,而長期以來DNA-RNA互作檢測技術(shù)沒有多少起色隧熙。
以下和各位分享DNA-RNA互作檢測技術(shù)——GRID-seq婉弹。
背景介紹
1953年听想,沃森(Watson)、克里克(Crick)發(fā)現(xiàn)了DNA雙螺旋結(jié)構(gòu)马胧,開啟了分子生物學(xué)時代汉买,使遺傳研究深入到分子層次,“生命之謎”被打開佩脊,人們清楚地了解遺傳信息的構(gòu)成和傳遞的途徑蛙粘。
隨著生物學(xué)技術(shù)的發(fā)展,科學(xué)家們發(fā)現(xiàn)真核生物的基因組是被高度折疊封裝在細(xì)胞核中的威彰,其中的結(jié)構(gòu)紛繁復(fù)雜出牧。研究至今,關(guān)于DNA歇盼、RNA序列與染色質(zhì)結(jié)構(gòu)的關(guān)系舔痕、潛在機(jī)制仍不明朗。
直到2009年豹缀,3D genome領(lǐng)軍人物Dekker在頂級期刊Science雜志上發(fā)表了Hi-C技術(shù)伯复。Hi-C技術(shù)為研究者在全基因組范圍內(nèi)捕獲DNA-DNA互作對提供了極其便利的工具。至此邢笙,3D genome這一新興領(lǐng)域的大門被打開啸如,一路蓬勃發(fā)展,已經(jīng)衍生出了眾多DNA-DNA互作檢測技術(shù)氮惯,使得研究者發(fā)現(xiàn)更多復(fù)雜的DNA-DNA互作關(guān)系叮雳。
到了2011年,關(guān)于RNA-RNA相互作用的技術(shù)和研究也陸續(xù)發(fā)表了出來妇汗,但是很長一段時間內(nèi)關(guān)于DNA-RNA互作的技術(shù)沒有明顯起色帘不。
眾所周知,細(xì)胞內(nèi)的轉(zhuǎn)錄機(jī)制非常復(fù)雜杨箭,也十分豐富寞焙,不僅表達(dá)編碼蛋白的mRNA,而且也存在大量的非編碼RNA(ncRNA)在行使調(diào)控功能告唆。有證據(jù)表明棺弊,許多ncRNAs可直接與染色質(zhì)互作晶密。一些ncRNA可能主要通過順式途徑介導(dǎo)基因組互作,表明特定的RNA-染色質(zhì)互作在基因表達(dá)調(diào)控中扮演重要的角色模她。
通過Hi-C分析染色質(zhì)結(jié)構(gòu)稻艰,可以檢測所有可能的DNA-DNA相互作用,通過ChIA-PET分析特定因子介導(dǎo)的染色質(zhì)相互作用侈净,但是這些技術(shù)檢測的主要都是非細(xì)胞類型依賴的拓?fù)湎嚓P(guān)結(jié)構(gòu)域 (TAD) 內(nèi)的尊勿,而染色質(zhì)上結(jié)合的RNA還可能幫助我們找到轉(zhuǎn)錄活性相關(guān)的相互作用,幫助我們區(qū)分超級增強(qiáng)子和普通增強(qiáng)子畜侦。
2017年元扔,來自加州大學(xué)的付向東研究團(tuán)隊(duì),研發(fā)了一種無偏差地檢測全部染色質(zhì)-RNA相互作用的技術(shù):GRID-seq(Global RNA interactions with DNA by deep sequencing)旋膳,相關(guān)論文發(fā)表在了Nature Biotechnology上澎语。
GRID-seq技術(shù)原理
捕獲全基因組范圍的DNA-RNA相互作用,流程圖如下:
簡要步驟如下:
- 設(shè)計(jì)特殊的linker验懊,一端是單鏈RNA擅羞,另一端是雙鏈DNA
- 使用DSG和甲醛固定RNA-DNA相互作用,提取細(xì)胞核
- 使用AluI 進(jìn)行酶切
- 加入linker進(jìn)行連接义图,linker的RNA與待捕獲的RNA連接
- 生物素富集减俏,對單鏈RNA部分反轉(zhuǎn)錄
- 去除游離的linker
- 使用磁珠捕獲DNA
- 從磁珠釋放ssDNA,合成dsDNA碱工,使用MmeI酶切娃承,將linker上的酶切位點(diǎn)切開
- 篩選目標(biāo)片段,85bp的是連接了RNA和DNA的linker怕篷,65bp的是只連接了RNA或者DNA的linker
GRID-seq數(shù)據(jù)分析展示
作者使用了人历筝、小鼠和果蠅三個物種的數(shù)據(jù)進(jìn)行分析和探討(文末已附上代碼和數(shù)據(jù)集來源)。
1.GRID-seq reads來源
- RNA reads主要來源于基因區(qū)域(外顯子匙头、內(nèi)含子)漫谷,表明它們源于多種多樣的不完整的剪切RNA仔雷。
- DNA reads主要來源于啟動子和基因間隔區(qū)域(下圖b)蹂析。
-
染色質(zhì)互作RNA數(shù)據(jù)與新生RNA數(shù)據(jù)(GRO-seq)的相關(guān)性比與RNA-seq數(shù)據(jù)的相關(guān)性更高(下圖c, d)。
這表明碟婆,GRID-seq更傾向于檢測染色質(zhì)上的新生RNA电抚。
2.全基因組染色質(zhì)-RNA互作
去除非特異性的信號后,檢測到868個mRNA和72個ncRNA高度富集在MDA-MB-231細(xì)胞系的染色質(zhì)上竖共◎眩互作圖顯示,只有少量的RNA與基因組發(fā)生反式相互作用(下圖a)公给。同時選取兩個代表性的染色體(100kb分辨率)進(jìn)行展示(下圖b)借帘。
圖a. 熱圖縱軸:染色質(zhì)富集的RNAs; 熱圖橫軸:人基因組1-Mb分辨率蜘渣。主要的反式互作標(biāo)記在右側(cè),其中U2-36P和U2-2P是U2 snRNA的兩個變體肺然。圖b. 兩個代表性染色體RNA-染色質(zhì)互作展示蔫缸,chr11(左)和chr17(右)。pc:編碼蛋白RNA际起,nc:非編碼RNA拾碌。
將GRID-seq數(shù)據(jù)與已公布的roX2 ChIRP、CHART數(shù)據(jù)以及MSL3的ChIP-seq數(shù)據(jù)相比街望,信號校翔、peak以及位置十分一致(下圖d, e, f)。
對染色質(zhì)富集的RNA進(jìn)行分類(local, cis, trans)顯示灾前,不同細(xì)胞系中絕大多數(shù)RNA屬于local(編碼基因的±10 Kb區(qū)域)和cis互作類型(極個別ncRNA除外)防症,下圖g, h, i,分別是人MDA-MB-231哎甲,mESCs和Drosophila S2細(xì)胞告希。
上述分析表明GRID-seq能發(fā)現(xiàn)已知的特異RNA-染色質(zhì)相互作用,并具有高特異性烧给、高敏感性的特點(diǎn)燕偶。
3.細(xì)胞類型特異的相互作用
對人MDA-MB-231和人MM.1S細(xì)胞進(jìn)行比較分析,以探討富集染色質(zhì)的RNA是否是細(xì)胞類型特異性础嫡。
對兩種細(xì)胞系的染色質(zhì)RNA進(jìn)行整體比較指么,發(fā)現(xiàn)大量RNA是兩種細(xì)胞系特有的(下圖b)。
盡管檢測到一些common的染色質(zhì)RNA榴鼎,但這些common RNA顯示出不同的交互模式(熱圖顏色表示交互強(qiáng)度高低)(下圖d)伯诬。
此外,除了未注釋的DNA元件巫财,RNA互作都以細(xì)胞類型特異的方式富集于活性啟動子和增強(qiáng)子盗似,許多共有的捕獲RNA,在兩種細(xì)胞中有著相似的染色質(zhì)互作豐度平项,與不同的增強(qiáng)子有關(guān)系赫舒。
4.超級增強(qiáng)子上的RNA
上述研究發(fā)現(xiàn),RNA會作用于活性增強(qiáng)子闽瓢。那么GRID-seq信號能否反映普通增強(qiáng)子(typical enhancer接癌,TE )和超級增強(qiáng)子(super ehancer, SE)的強(qiáng)度差異?
作者以染色質(zhì)RNA互作水平為標(biāo)準(zhǔn)扣讼,對活性增強(qiáng)子進(jìn)行排序缺猛,發(fā)現(xiàn)top 10%的鄰近增強(qiáng)子的基因活性比bottom 10%強(qiáng)(下圖c)。這些與RNA高度關(guān)聯(lián)的增強(qiáng)子,正是MM.1S細(xì)胞中的超級增強(qiáng)子荔燎。
不同類型的遠(yuǎn)距離元件上S2細(xì)胞特異的RNA交互水平也證實(shí)H3K27ac修飾的增強(qiáng)子和染色質(zhì)富集RNA具有較強(qiáng)的關(guān)聯(lián)(下圖f)耻姥。下圖中REDfly是增強(qiáng)子數(shù)據(jù)庫。
上述研究說明有咨,活性增強(qiáng)子與染色質(zhì)富集RNA有較強(qiáng)的關(guān)系咏闪,可以借助活性增強(qiáng)子來鑒定染色質(zhì)富集的RNA。
5.RNA-染色質(zhì)相互作用與TAD
在細(xì)胞核的三維空間中摔吏,不同的DNA分子是如何相互作用的鸽嫂,Hi-C和ChIA-PET技術(shù)可用于研究這個問題。但是征讲,Hi-C或RNAPII ChIA-PET難以區(qū)分活性轉(zhuǎn)錄基因和非活性或轉(zhuǎn)錄上靜止的基因据某。Hi-C檢測的是全部類型的 DNA-DNA相互作用,而GRID-seq捕獲的是只生成RNA的基因與DNA元件的相互作用诗箍。選取了Hi-C單個基因的部分與GRID-seq的數(shù)據(jù)作比較癣籽。
對mESC細(xì)胞系RNA交互和HiC交互情況進(jìn)行橫向比較(下圖b,c),并在整體上對交互水平進(jìn)行Pearson’s Correlation Coefficient(PCC)計(jì)算(下圖d)滤祖。
mESC樣本表明筷狼,GRID-seq和Hi-C的Pearson相關(guān)系數(shù)表明它們有著高度一致性。進(jìn)一步對TAD內(nèi)部的信號和交互情況進(jìn)行了探討匠童,同樣呈現(xiàn)高度的一致性和相關(guān)性埂材。
上述研究表明,染色質(zhì)與RNA的相互作用主要存在于細(xì)胞核的高級結(jié)構(gòu)中汤求,GRID-seq技術(shù)可應(yīng)用于預(yù)測與RNA生成有關(guān)的基因組相互作用俏险,可作為現(xiàn)有的3D genome研究的補(bǔ)充。
6.啟動子與增強(qiáng)子的聯(lián)系
基于Hi-C扬绪、GRID-seq數(shù)據(jù)竖独,作者進(jìn)一步深入研究轉(zhuǎn)錄相關(guān)的基因組相互作用,來探討一個長期未能解決的問題挤牛,即3D genome中增強(qiáng)子和活性啟動子如何相互作用莹痢?
作者首先鑒定出啟動子-啟動子和啟動子-增強(qiáng)子的互作結(jié)果,并使用Cytoscape進(jìn)行可視化(下圖a)墓赴。每個啟動子關(guān)聯(lián)的RNA最多可達(dá)4個竞膳,表明一個基因的啟動子可能作為其他基因的增強(qiáng)子。每個富集染色質(zhì)的RNA能與多種typical增強(qiáng)子相互作用竣蹦,但只和1-2個超級增強(qiáng)子發(fā)生相互作用顶猜。相反,無論普通或者超級增強(qiáng)子痘括,大部分都與一個或兩個基因來源的RNA相互作用。
最后,利用GRID-seq和Cytoscape軟件繪制全基因組相互作用網(wǎng)絡(luò)纲菌,展示了單個染色體的結(jié)構(gòu)(下圖g)挠日。
上述結(jié)果表明,在很多增強(qiáng)子控制一個基因的同時翰舌,每個增強(qiáng)子無論是普通還是超級增強(qiáng)子嚣潜,調(diào)控著一系列高度特異的靶基因。盡管檢測到的染色體間的啟動子-啟動子互作很少椅贱,但是的確觀察到了染色體間的特異互作懂算。
接下來,需要進(jìn)一步驗(yàn)證這些預(yù)測到的染色體間的相互作用(特別是在單細(xì)胞水平)庇麦,有助于進(jìn)一步了解細(xì)胞核3D空間的基因組結(jié)構(gòu)计技。
總 結(jié)
作者通過設(shè)計(jì)一種特殊的linker來連接RNA和DNA,從而實(shí)現(xiàn)了全基因組范圍內(nèi)的RNA-DNA相互作用的檢測和分析山橄。
本研究垮媒,利用人、小鼠和果蠅細(xì)胞的GRID-seq數(shù)據(jù)對RNA-DNA相互作用模式進(jìn)行較為詳盡的闡述航棱,同時與Hi-C等數(shù)據(jù)進(jìn)行了比較睡雇,另外對染色質(zhì)富集RNA的分布特征進(jìn)行了探討。
越來越多的研究表明饮醇,新生RNA和非編碼RNA都參與了染色質(zhì)上一系列的調(diào)控過程它抱,如:通過招募RNA依賴的DNA甲基轉(zhuǎn)移酶、轉(zhuǎn)錄激活劑或抑制劑進(jìn)行表達(dá)調(diào)控朴艰。
總而言之抗愁,GRID-seq技術(shù)的建立和發(fā)展,有助于科學(xué)研究者發(fā)現(xiàn)更多RNA介導(dǎo)的調(diào)控活動呵晚。
參考文獻(xiàn)
1.Lieberman-Aiden E, Van Berkum N L, Williams L, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. SCIENCE, 2009.
2.Kudla G, Granneman S, Hahn D, et al. Cross-linking, ligation, and sequencing of hybrids reveals RNA–RNA interactions in yeast. PNAS, 2011.
3.Xiao Li, Bing Zhou, Liang Chen, et al. GRID-seq reveals the global RNA–chromatin interactome. Nature Biotechnology, 2017.
良心補(bǔ)充蜘腌,快來獲取代碼和數(shù)據(jù)集
本文GRID-seq相關(guān)數(shù)據(jù)集和代碼可以參考UCSD頁面:http://fugenome.ucsd.edu/gridseq/
該頁面存放了主要的分析腳本和樣本數(shù)據(jù)集信息,具體腳本不再討論:
GRID-seq Pipeline
1.Raw data processing script: gridseqMain.sh
2.Enhancer-promoter interaction: gridseqSubnet.sh
3.Sub-function script: gridRsub.getGeneHitCutoff.RGRID-seq peaks of chromatin-enriched RNAs (BedGraph)
1.human MDA-MB-231: gridseq.MDA231.bdg.tar.gz
2.human MM.1S: gridseq.MM1S.bdg.tar.gz
3.mouse mESC: gridseq.mESC.bdg.tar.gz
4.Drosophila S2: gridseq.S2.bdg.tar.gzGRID-seq raw data (fastq) and processed datasets are accessible at GEO: GSE82312
GRID-seq raw data (fastq) are also accessible at SRA: SRP076189 with detail information as below: