文章來源:科研圈?2018-05-12
北京大學生命科學學院賈璐萌,李亭亭(李程研究組)
上回說到Hi-C更適用于研究大尺Hi度上的染色質結構,而不適用于研究轉錄調(diào)控元件之間的相互作用子巾。
轉錄調(diào)控元件主要包括啟動子,增強子,絕緣子和抑制子兵钮。在轉錄的起始階段河咽,基因的啟動子與其他遠距離調(diào)控元件(增強子钠右,絕緣子和抑制子)空間靠近(圖4)。距離調(diào)控元件通過幫助啟動子招募具有抑制或者激活功能的轉錄相關蛋白忘蟹,調(diào)控基因的轉錄(Zhang et al飒房。,2013)媚值。為了結合轉錄相關蛋白狠毯,這些轉錄調(diào)控元件通常缺少核小體的結合,這使用活躍調(diào)控區(qū)域的染色質相對開放(開放染色質)褥芒。針對轉錄調(diào)控元件的這些特點嚼松,可通過捕獲轉錄相關蛋白結合區(qū)域[ChIP-seq(Johnson et al。喂很,2007)]和捕獲染色質開放區(qū)域[DNase-seq(Boyle等人惜颇,2008),F(xiàn)AIRE-seq(Giresi等人少辣,2007)凌摄,MNase-seq(Schlesinger等人,2013)漓帅,ATAC-seq(Buenrostro等人锨亏,2013) -seq(Ponnaluri等,2017)]的技術來檢測轉錄調(diào)控元件忙干。
為了更好的捕獲基因組轉錄調(diào)控元件之間的遠距離相互作用器予,結合轉錄調(diào)控元件檢測技術的其他染色質構象捕獲方法被提出。這些方法主要包括三類捐迫。
第一類乾翔,是轉錄相關蛋白介導的染色質相互作用的捕獲技術(Chia-PET(Fullwood等人,2009)施戴,HiChIP(Mumbach等人反浓,2016),PLAC-seq(Fang等人赞哗, 2016))雷则。在這類技術中,最早被提出的是阮一駿等開發(fā)的嘉PET技術(圖5)肪笋。在上回說到喜-C更適用于研究大尺度上的染色質結構月劈,而不適用于研究轉錄調(diào)控元件之間的相互作用度迂。
轉錄調(diào)控元件主要包括啟動子,增強子猜揪,絕緣子和抑制子惭墓。在轉錄的起始階段,基因的啟動子與其他遠距離調(diào)控元件(增強子而姐,絕緣子和抑制子)空間靠近(圖4)诅妹。距離調(diào)控元件通過幫助啟動子招募具有抑制或者激活功能的轉錄相關蛋白,調(diào)控基因的轉錄(Zhang et al毅人。,2013)尖殃。為了結合轉錄相關蛋白丈莺,這些轉錄調(diào)控元件通常缺少核小體的結合,這使用活躍調(diào)控區(qū)域的染色質相對開放(開放染色質)送丰。針對轉錄調(diào)控元件的這些特點缔俄,可通過捕獲轉錄相關蛋白結合區(qū)域[ChIP-seq(Johnson et al。器躏,2007)]和捕獲染色質開放區(qū)域[DNase-seq(Boyle等人俐载,2008),F(xiàn)AIRE-seq(Giresi等人登失,2007)遏佣,MNase-seq(Schlesinger等人,2013)揽浙,ATAC-seq(Buenrostro等人状婶,2013) -seq(Ponnaluri等,2017)]的技術來檢測轉錄調(diào)控元件馅巷。
為了更好的捕獲基因組轉錄調(diào)控元件之間的遠距離相互作用膛虫,結合轉錄調(diào)控元件檢測技術的其他染色質構象捕獲方法被提出。這些方法主要包括三類钓猬。
第一類稍刀,是轉錄相關蛋白介導的染色質相互作用的捕獲技術(Chia-PET(Fullwood等人,2009)敞曹,HiChIP(Mumbach等人账月,2016),PLAC-seq(Fang等人异雁, 2016))捶障。在這類技術中,最早被提出的是阮一駿等開發(fā)的嘉PET技術(圖5)纲刀。在嘉PET技術中项炼,交聯(lián)好的染色質首先被超聲打碎成獨立的相互作用復合體;結合有目的蛋白的復合體通過免疫沉淀技術被富集;目的蛋白結合的復合體的DNA末端被連接包含MMEI位點的生物素化寡核苷酸接頭;通過連接體間的連接担平,目的蛋白介導的存在相互作用的DNA被連接至同一片段; MmeI片段化DNA后,DNA被純化;隨后PET片段被建立庫測序.Chia-PET作為一種可以有效富集蛋白介導的染色質間相互作用的技術锭部,自開發(fā)以來暂论,得到了廣泛的應用.RNAPII ChIA-PET及CTCF ChIA-PET技術不僅幫助解析了轉錄相關的染色質拓撲結構(Li等,2012; Tang等拌禾,2015 )取胎,還成功幫助解?了解非編碼區(qū)SNP位點對遠距離調(diào)控基因表達的影響(Tang et al。湃窍,2015)闻蛀。2017年,同樣是用于捕獲基因組轉換調(diào)控元件之間的遠距離相互作用的技術Hi-ChIP(Mumbach這兩種技術都在Hi-C技術的基礎上結合了免疫沉淀技術您市,從實驗目的上與ChIA-PET一致觉痛,目前來看,與嘉PET技術相比茵休,喜芯片與PLAC-SEQ能得到更高比例的有效讀取薪棒。相信喜芯片與PLAC-seq的也將被廣泛應用于蛋白介導的染色質相互作用的研究。
第二類榕莺,是目的探針所在區(qū)域的染色質相互作用的捕獲(Capture Hi-C)俐芯。這類技術以啟動子捕獲Hi-C(Mifsud等,2015)技術為代表钉鸯,根據(jù)啟動子區(qū)域設計RNA探針吧史,在高 - C實驗的基礎上加入了一步探針的富集,檢測啟動子探針所在區(qū)域的染色質相互作用唠雕。
第三類扣蜻,是基于開放染色質間相互作用的捕獲[DNase Hi-C(Ma等人,2015)及塘,Micro-C(Hsieh等人莽使,2015),BL-Hi-C(Liang等人笙僚, 芳肌,DNase Hi-C技術使用DNase酶取代Hi-C實驗中的限制性內(nèi)切酶,消化染色質肋层,可特異性地捕獲DNase I敏感的開放染色質間相互作用(Ma et al亿笤。 ,2015).Micro-C技術使用MNase取代Hi-C實驗中的限制性內(nèi)切酶消化染色質栋猖,可以得到核小體尺度分辨率的DNA相互作用圖譜(Hsieh等净薛,2015).BL- Hi-C技術使用識別序列為“GGCC”的限制性內(nèi)切酶HaeIII進行染色質消化。由于結合有轉錄相關蛋白及結構蛋白的活躍染色質區(qū)域DNA的GC堿基組成比例更高蒲拉,故BL-喜-C可富集高GC區(qū)域的活躍染色質間的相互作用肃拜。
這些方法各有優(yōu)劣及側重痴腌,從不同層面上解析染色質空間結構,回答重要生物學問題.Chia-PET(Fullwood等人燃领,2009)士聪,HiChIP(Mumbach等人,2016)猛蔽,PLAC-seq (Fang et al剥悟。,2016)僅能捕獲某一種蛋白介導的染色質間的相互作用; Capture Hi-C技術通過特異性探針曼库,捕獲探針所在區(qū)域(如啟動子區(qū))染色質間相互作用(Mifsud et al区岗。,2015); DNase Hi-C雖然可以富集開放染色質之間的相互作用毁枯,但是由于DNase I整合效率非常高躏尉,高度片段化的染色質之間自連或隨機連接,減少了真實相互作用的捕獲比例(Li et al后众。,2018).BL-Hi-C捕獲了10000多個高GC區(qū)域的染色質相互作用颅拦,這些相互作用大多是CTCF HiChIP及RNAPII HiChIP的子集蒂誉。這些技術雖然各有優(yōu)勢,然而大都依賴目的蛋白距帅,探針序列右锨,酶切偏好。綜上所述碌秸,一種不依賴于探針序列及蛋白抗體绍移,用染色質開放程度為富集條件,直接高效富集全基?組活躍轉錄調(diào)控元件間相互作用的技術需要被開發(fā)讥电。
OCEAN-C(Open Chromatin Enrichment And Network Hi-C)技術(圖 6)(Li et al., 2018)是結合了 FAIRE-seq 技術及 Hi-C 技術的關鍵步驟而開發(fā)的一種可以不依賴蛋白抗體及靶序列的新技術蹂窖。在OCEAN-C技術中,染色質首先被甲醛交聯(lián)恩敌;隨后瞬测,染色質被限制性內(nèi)切酶(MboI)消化;DNA末端修復時引入帶有生物素標記的脫氧核糖核苷酸纠炮;隨后空間存在相互作用的DNA被連接月趟;超聲打斷染色質后,開放染色質被酚-氯仿抽提恢口;最后孝宗,存在相互作用的開放染色質因為有生物素信號,可以被富集用于后續(xù)文庫構建耕肩。?
need-to-insert-img
與其他技術相比因妇,第一:OCEAN- C 技術不僅能檢測到TAD问潭、compartments等三維基因組結構,而且同時富集開放染色質區(qū)域及這些開放染色質之間的相互作用沙峻。第二:我們在三種 B 細胞相關細胞(U266睦授,RPMI8226,GM12878)中應用了 OCEAN-C 技術摔寨,發(fā)現(xiàn)三種細胞中均有近 10000 個開放染色質相互作用中心(HOCI)去枷。HOCI長度在 1 kb 左右、以活躍啟動子及增強子為主是复、并結合有大量轉錄相關蛋白删顶。許多HOCI也與Super-enhancer、broad H3K4me3區(qū)域有重合淑廊,幫助理解這些新發(fā)現(xiàn)的重要調(diào)控區(qū)域內(nèi)部和之間的互作(圖7)逗余。第三:HOCI作為相互作用網(wǎng)絡的重要節(jié)點,與其他開放染色質互作季惩,形成全基因組開放染色質相互作用網(wǎng)絡录粱,調(diào)控基因表達(圖8)。
need-to-insert-img
?隨著二代測序技術的發(fā)展画拾,越來越多的染色質構象捕獲技術被開發(fā)啥繁。三維基因組實驗技術的應用越來越廣泛,在細胞周期青抛、細胞分化旗闽、疾病、指導基因組組裝等各方面的研究中都有應用蜜另。例如适室,Hi-C技術用于研究細胞有絲分裂過程中的染色質結構變化:在有絲分裂中期,染色質會失去分區(qū)和 TAD結構举瑰,坍縮為一個密集的染色質狀態(tài) (Naumova et al., 2013)捣辆;5C技術用于研究干細胞分化過程中核染色質的變化:在分化過程中,由于染色質三維結構的變化此迅,OCT4的啟動子和遠程增強子的相互作用減弱罪帖,導致OCT4表達量下降,促進細胞分化 (Beagan et al., 2016)邮屁。Hi-C技術同樣成功揭示了TAD邊界的變化對疾病產(chǎn)生的影響:TAD邊界遭到破壞造成原本被隔離的增強子與啟動子形成異常的相互作用整袁,導致基因時空表達的紊亂而產(chǎn)生疾病,如手指畸形疾病 (Lupianez et al., 2015)和大腦膠質瘤 (Flavahan et al., 2016)佑吝;
如今坐昙,隨著三維基因組研究方法的更新和研究范圍的擴展,越來越多的新的染色質構象捕獲技術被開發(fā)芋忿。最近炸客,曹罡課題組和李國亮課題組又合作開發(fā)了更加高效經(jīng)濟的DLO Hi-C技術(Lin et al., 2018)疾棵。不僅如此,單細胞Hi-C技術也逐漸被開發(fā) (Flyamer et al., 2017; Nagano et al., 2013; Ramani et al., 2017)痹仙。2014年美國國立衛(wèi)生研究院(NIH)為此專門制定了4DN計劃(4D Nucleome)(Dekker et al., 2017)是尔,斥資1.2億美元資助了24個研究項目。4DN計劃結合三維基因組學开仰、單細胞測序拟枚、單細胞實時成像等前沿技術,開展標準化众弓、高通量恩溅、單細胞層面、可動態(tài)觀測的三維基因組學技術和應用研究谓娃。這些技術和項目融合了多學科的技術脚乡,將極大地促進后基因組學時代從基因組的一維列研究向四維的基因組空間結構和隨時間變化的研究轉變。我們將繼續(xù)開發(fā)和應用OCEAN-C技術滨达,研究以富集超級增強子奶稠、broad H3K4me3等結合有大量轉錄因子的基因調(diào)控元件間的相互作用,并與基因表達變化關聯(lián)捡遍,幫助進一步闡明基因組結構锌订、功能與疾病的關系。
技術中稽莉,交聯(lián)好的染色質首先被超聲打碎成獨立的相互作用復合體;結合有目的蛋白的復合體通過免疫沉淀技術被富集;目的蛋白結合的復合體的DNA末端被連接包含MMEI位點的生物素化寡核苷酸接頭;通過連接體間的連接,目的蛋白介導的存在相互作用的DNA被連接至同一片段; MmeI片段化DNA后涩搓,DNA被純化;隨后PET片段被建立庫測序.Chia-PET作為一種可以有效富集蛋白介導的染色質間相互作用的技術污秆,自開發(fā)以來,得到了廣泛的應用.RNAPII ChIA-PET及CTCF ChIA-PET技術不僅幫助解析了轉錄相關的染色質拓撲結構(Li等昧甘,2012; Tang等良拼,2015 ),還成功幫助解?了解非編碼區(qū)SNP位點對遠距離調(diào)控基因表達的影響(Tang et al充边。庸推,2015)。2017年浇冰,同樣是用于捕獲基因組轉換調(diào)控元件之間的遠距離相互作用的技術Hi-ChIP(Mumbach這兩種技術都在Hi-C技術的基礎上結合了免疫沉淀技術贬媒,從實驗目的上與ChIA-PET一致,目前來看肘习,與嘉PET技術相比际乘,喜芯片與PLAC-SEQ能得到更高比例的有效讀取。相信喜芯片與PLAC-seq的也將被廣泛應用于蛋白介導的染色質相互作用的研究漂佩。
第二類脖含,是目的探針所在區(qū)域的染色質相互作用的捕獲(Capture Hi-C)罪塔。這類技術以啟動子捕獲Hi-C(Mifsud等,2015)技術為代表养葵,根據(jù)啟動子區(qū)域設計RNA探針征堪,在高 - C實驗的基礎上加入了一步探針的富集,檢測啟動子探針所在區(qū)域的染色質相互作用关拒。
第三類佃蚜,是基于開放染色質間相互作用的捕獲[DNase Hi-C(Ma等人,2015)夏醉,Micro-C(Hsieh等人爽锥,2015),BL-Hi-C(Liang等人畔柔, 氯夷,DNase Hi-C技術使用DNase酶取代Hi-C實驗中的限制性內(nèi)切酶,消化染色質靶擦,可特異性地捕獲DNase I敏感的開放染色質間相互作用(Ma et al腮考。 ,2015).Micro-C技術使用MNase取代Hi-C實驗中的限制性內(nèi)切酶消化染色質玄捕,可以得到核小體尺度分辨率的DNA相互作用圖譜(Hsieh等踩蔚,2015).BL- Hi-C技術使用識別序列為“GGCC”的限制性內(nèi)切酶HaeIII進行染色質消化。由于結合有轉錄相關蛋白及結構蛋白的活躍染色質區(qū)域DNA的GC堿基組成比例更高枚粘,故BL-喜-C可富集高GC區(qū)域的活躍染色質間的相互作用馅闽。
這些方法各有優(yōu)劣及側重,從不同層面上解析染色質空間結構馍迄,回答重要生物學問題.Chia-PET(Fullwood等人福也,2009),HiChIP(Mumbach等人攀圈,2016)暴凑,PLAC-seq (Fang et al。赘来,2016)僅能捕獲某一種蛋白介導的染色質間的相互作用; Capture Hi-C技術通過特異性探針现喳,捕獲探針所在區(qū)域(如啟動子區(qū))染色質間相互作用(Mifsud et al。犬辰,2015); DNase Hi-C雖然可以富集開放染色質之間的相互作用嗦篱,但是由于DNase I整合效率非常高,高度片段化的染色質之間自連或隨機連接幌缝,減少了真實相互作用的捕獲比例(Li et al默色。,2018).BL-Hi-C捕獲了10000多個高GC區(qū)域的染色質相互作用,這些相互作用大多是CTCF HiChIP及RNAPII HiChIP的子集腿宰。這些技術雖然各有優(yōu)勢呕诉,然而大都依賴目的蛋白,探針序列吃度,酶切偏好甩挫。綜上所述,一種不依賴于探針序列及蛋白抗體椿每,用染色質開放程度為富集條件伊者,直接高效富集全基?組活躍轉錄調(diào)控元件間相互作用的技術需要被開發(fā)。
OCEAN-C(Open Chromatin Enrichment And Network Hi-C)技術(圖 6)(Li et al., 2018)是結合了 FAIRE-seq 技術及 Hi-C 技術的關鍵步驟而開發(fā)的一種可以不依賴蛋白抗體及靶序列的新技術间护。在OCEAN-C技術中亦渗,染色質首先被甲醛交聯(lián);隨后汁尺,染色質被限制性內(nèi)切酶(MboI)消化法精;DNA末端修復時引入帶有生物素標記的脫氧核糖核苷酸;隨后空間存在相互作用的DNA被連接痴突;超聲打斷染色質后搂蜓,開放染色質被酚-氯仿抽提;最后辽装,存在相互作用的開放染色質因為有生物素信號帮碰,可以被富集用于后續(xù)文庫構建。?
與其他技術相比拾积,第一:OCEAN- C 技術不僅能檢測到TAD殉挽、compartments等三維基因組結構,而且同時富集開放染色質區(qū)域及這些開放染色質之間的相互作用拓巧。第二:我們在三種 B 細胞相關細胞(U266斯碌,RPMI8226,GM12878)中應用了 OCEAN-C 技術玲销,發(fā)現(xiàn)三種細胞中均有近 10000 個開放染色質相互作用中心(HOCI)输拇。HOCI長度在 1 kb 左右摘符、以活躍啟動子及增強子為主贤斜、并結合有大量轉錄相關蛋白。許多HOCI也與Super-enhancer逛裤、broad H3K4me3區(qū)域有重合瘩绒,幫助理解這些新發(fā)現(xiàn)的重要調(diào)控區(qū)域內(nèi)部和之間的互作(圖7)。第三:HOCI作為相互作用網(wǎng)絡的重要節(jié)點带族,與其他開放染色質互作锁荔,形成全基因組開放染色質相互作用網(wǎng)絡,調(diào)控基因表達(圖8)蝙砌。
?隨著二代測序技術的發(fā)展阳堕,越來越多的染色質構象捕獲技術被開發(fā)跋理。三維基因組實驗技術的應用越來越廣泛,在細胞周期恬总、細胞分化前普、疾病、指導基因組組裝等各方面的研究中都有應用壹堰。例如拭卿,Hi-C技術用于研究細胞有絲分裂過程中的染色質結構變化:在有絲分裂中期,染色質會失去分區(qū)和 TAD結構贱纠,坍縮為一個密集的染色質狀態(tài) (Naumova et al., 2013)峻厚;5C技術用于研究干細胞分化過程中核染色質的變化:在分化過程中,由于染色質三維結構的變化谆焊,OCT4的啟動子和遠程增強子的相互作用減弱惠桃,導致OCT4表達量下降,促進細胞分化 (Beagan et al., 2016)懊渡。Hi-C技術同樣成功揭示了TAD邊界的變化對疾病產(chǎn)生的影響:TAD邊界遭到破壞造成原本被隔離的增強子與啟動子形成異常的相互作用刽射,導致基因時空表達的紊亂而產(chǎn)生疾病,如手指畸形疾病 (Lupianez et al., 2015)和大腦膠質瘤 (Flavahan et al., 2016)剃执;
如今誓禁,隨著三維基因組研究方法的更新和研究范圍的擴展,越來越多的新的染色質構象捕獲技術被開發(fā)肾档。最近摹恰,曹罡課題組和李國亮課題組又合作開發(fā)了更加高效經(jīng)濟的DLO Hi-C技術(Lin et al., 2018)。不僅如此怒见,單細胞Hi-C技術也逐漸被開發(fā) (Flyamer et al., 2017; Nagano et al., 2013; Ramani et al., 2017)俗慈。2014年美國國立衛(wèi)生研究院(NIH)為此專門制定了4DN計劃(4D Nucleome)(Dekker et al., 2017),斥資1.2億美元資助了24個研究項目遣耍。4DN計劃結合三維基因組學闺阱、單細胞測序、單細胞實時成像等前沿技術舵变,開展標準化酣溃、高通量、單細胞層面纪隙、可動態(tài)觀測的三維基因組學技術和應用研究赊豌。這些技術和項目融合了多學科的技術,將極大地促進后基因組學時代從基因組的一維列研究向四維的基因組空間結構和隨時間變化的研究轉變绵咱。我們將繼續(xù)開發(fā)和應用OCEAN-C技術碘饼,研究以富集超級增強子、broad H3K4me3等結合有大量轉錄因子的基因調(diào)控元件間的相互作用,并與基因表達變化關聯(lián)艾恼,幫助進一步闡明基因組結構住涉、功能與疾病的關系。