在過去的50年中仔粥,從廣義上講溪食,已經(jīng)了解了控制基因表達(dá)的三個(gè)基本基因組元件:啟動(dòng)子(promoters),增強(qiáng)子(enhancers)和邊界元件(boundary elements)。啟動(dòng)子通常位于基因的轉(zhuǎn)錄起始位點(diǎn)(TSS)附近。增強(qiáng)子和邊界元件可能位于基因之內(nèi)脆贵,但更常見的是分布在非編碼DNA兩側(cè)的各種距離(1-1,000 kb)處∑鹉海基因及其調(diào)控元件只占據(jù)人類基因組的約5-15%卖氨,目前仍不清楚其他非編碼序列的作用。而將整個(gè)二倍體人類基因組~6.5 Gb DNA(相當(dāng)于2 m DNA)壓縮并折疊到每個(gè)細(xì)胞核中负懦,則是通過將DNA整合為染色質(zhì)筒捺,形成連續(xù)的高級(jí)結(jié)構(gòu)以及最終形成染色體來實(shí)現(xiàn)。
在哺乳動(dòng)物中纸厉,核心啟動(dòng)子定義為足以準(zhǔn)確啟動(dòng)基礎(chǔ)基因表達(dá)的連續(xù)DNA序列的最小區(qū)域系吭。它包括TSS,并且可以在TSS的上游和/或下游延伸約35-40 bp颗品。DNA的這一小片段是招募預(yù)起始復(fù)合物(pre-initiation complex)的平臺(tái)肯尺。啟動(dòng)子通常在兩個(gè)方向上轉(zhuǎn)錄,盡管通常只在一個(gè)方向上轉(zhuǎn)錄才能轉(zhuǎn)錄相關(guān)基因躯枢;在相反方向上移動(dòng)產(chǎn)生的轉(zhuǎn)錄本通常較短且不穩(wěn)定蟆盹。與核心啟動(dòng)子相關(guān)的序列motifs及結(jié)合位點(diǎn)十分多樣,鑒定出的第一個(gè)核心啟動(dòng)子序列是TATA box闺金,之后發(fā)現(xiàn)了其他頻繁重復(fù)的核心啟動(dòng)子序列,包括initiator element(Inr)峰档、下游啟動(dòng)子元件败匹、下游核心元件以及上游和下游TFⅡB識(shí)別元件等等。最常見的核心啟動(dòng)子元件是位于CpG島內(nèi)簡單的富含GC的DNA區(qū)域讥巡。各個(gè)核心啟動(dòng)子中不同序列的組合可能募集不同的預(yù)啟動(dòng)復(fù)合體及其相關(guān)因子掀亩,其中一些在特定細(xì)胞類型和發(fā)育階段表達(dá)。啟動(dòng)子的異質(zhì)性可以結(jié)合普遍存在的和/或組織特異性的轉(zhuǎn)錄因子欢顷,以調(diào)節(jié)不同細(xì)胞環(huán)境中啟動(dòng)子的活性和強(qiáng)度槽棍。
單個(gè)增強(qiáng)子是DNA的短區(qū)域,可激活它們所調(diào)控基因的轉(zhuǎn)錄抬驴,而與它們相對(duì)于目標(biāo)啟動(dòng)子的位置炼七,距離或方向無關(guān)。一些增強(qiáng)子在其靶基因之內(nèi)或附近布持,還有些增強(qiáng)子位于基因較遠(yuǎn)的上游或下游區(qū)域(1-1,000 kb)豌拙。增強(qiáng)子通常包含針對(duì)組織特異性和發(fā)育階段特異性轉(zhuǎn)錄因子的多個(gè)結(jié)合位點(diǎn),因此普遍認(rèn)為增強(qiáng)子是整合整個(gè)分化和發(fā)育過程中發(fā)生的信號(hào)傳導(dǎo)和轉(zhuǎn)錄程序题暖,并將該信息傳達(dá)給控制基因的啟動(dòng)子按傅。結(jié)合的轉(zhuǎn)錄因子可以募集共激活蛋白捉超,它們在轉(zhuǎn)錄周期的各個(gè)階段起作用以調(diào)節(jié)基因表達(dá)。就像啟動(dòng)子一樣唯绍,增強(qiáng)子也募集RNA Pol II拼岳,并雙向轉(zhuǎn)錄,產(chǎn)生小的况芒,不穩(wěn)定的增強(qiáng)子RNA惜纸,這些RNA會(huì)被迅速降解。增強(qiáng)子在哺乳動(dòng)物基因組中遠(yuǎn)遠(yuǎn)超過蛋白質(zhì)編碼基因牛柒,因此推測許多基因受一種以上的增強(qiáng)子控制堪簿。在多個(gè)組織和/或發(fā)育階段具有特定表達(dá)模式的基因通常受幾種不同的增強(qiáng)子調(diào)控,這些增強(qiáng)子對(duì)各個(gè)組織或發(fā)育階段特異性表達(dá)的轉(zhuǎn)錄因子做出調(diào)控皮壁。
當(dāng)啟動(dòng)子和增強(qiáng)子都具有活性時(shí)椭更,它們都是小的無核小體的DNA元件,它們募集了大型蛋白質(zhì)復(fù)合物蛾魄,比如轉(zhuǎn)錄因子虑瀑、介導(dǎo)復(fù)合物和起始前復(fù)合物,并且都被雙向轉(zhuǎn)錄滴须。另外舌狗,有活性的增強(qiáng)子和啟動(dòng)子由相似的染色質(zhì)修飾標(biāo)記。主要區(qū)別在于增強(qiáng)子可以在很長的距離內(nèi)起作用扔水,并傾向于募集組織特異性因子痛侍;而啟動(dòng)子通常位于TSS的直接上游,并且更經(jīng)常募集無處不在的表達(dá)因子魔市。此外主届,從啟動(dòng)子的轉(zhuǎn)錄往往是與RNA Pol II的特異性磷酸化相關(guān)的有效單向延伸,以及在組蛋白H3 Lys4與Lys36的較高三甲基化水平(H3K4me3/H3K36me3)待德。相比之下君丁,增強(qiáng)子引起相對(duì)較低的轉(zhuǎn)錄水平,產(chǎn)生快速降解的增強(qiáng)子RNA将宪,通常以染色質(zhì)甲基化水平較低為特征绘闷,主要是組蛋白H3在Lys4處單甲基化(H3K4me1)。已經(jīng)表明较坛,某些元件既可以充當(dāng)一個(gè)基因的啟動(dòng)子印蔗,又可以充當(dāng)另一個(gè)基因的遠(yuǎn)端增強(qiáng)子。
在哺乳動(dòng)物中丑勤,邊界元件經(jīng)常與鋅指CCCTC結(jié)合因子(CTCF)結(jié)合喻鳄,通常與粘著蛋白cohesin聯(lián)系在一起。隨著第一批哺乳動(dòng)物基因組三維結(jié)構(gòu)高分辨率全基因組圖譜的生成确封,很明顯除呵,染色質(zhì)結(jié)構(gòu)域的邊界強(qiáng)烈地富集CTCF的結(jié)合位點(diǎn)再菊,這些位點(diǎn)大多以收斂方向排列。因此颜曾,“邊界元件”一詞現(xiàn)在通常指的是在染色質(zhì)域的邊界劃分中起結(jié)構(gòu)作用的元素纠拔。在哺乳動(dòng)物體內(nèi),基因組中只有一組正確定位的CTCF結(jié)合位點(diǎn)作為結(jié)構(gòu)邊界泛豪。此外稠诲,結(jié)構(gòu)性染色質(zhì)域的邊界也富集有活躍轉(zhuǎn)錄基因的啟動(dòng)子,這表明啟動(dòng)子也可能具有邊界功能诡曙。
將上述三者密切聯(lián)系在一起的是環(huán)擠壓模型臀叙,加之結(jié)合在調(diào)控元件上的蛋白質(zhì)之間的親和力,從而形成特定的增強(qiáng)子-啟動(dòng)子互作价卤。當(dāng)cohesin復(fù)合物沿著染色質(zhì)纖維移位并擠出一個(gè)環(huán)時(shí)劝萤,它將調(diào)控元件帶得很近。當(dāng)cohesin復(fù)合物接近位于邊界元件的CTCF氨基末端時(shí)慎璧,cohesin復(fù)合物就停止了床嫌。在這些區(qū)域內(nèi),形成了包含多個(gè)增強(qiáng)子和啟動(dòng)子相互作用的高階樞紐結(jié)構(gòu)胸私。這些結(jié)構(gòu)很可能是環(huán)擠壓和增強(qiáng)子/啟動(dòng)子結(jié)合因子之間的蛋白質(zhì)-蛋白質(zhì)相互作用的結(jié)果厌处,盡管這兩個(gè)過程的確切作用仍不是特別清楚。
目前已經(jīng)清楚的是岁疼,染色質(zhì)以動(dòng)態(tài)狀態(tài)存在阔涉,并且染色質(zhì)高級(jí)結(jié)構(gòu)隨局部基因活性和表觀遺傳修飾而不同。然而捷绒,一個(gè)重要的瑰排、尚未解決的問題是基因組的高級(jí)結(jié)構(gòu)與基因表達(dá)調(diào)控之間的關(guān)系。染色質(zhì)結(jié)構(gòu)是獨(dú)立編碼的嗎疙驾?它們在調(diào)節(jié)或促進(jìn)基因表達(dá)中起指導(dǎo)作用,還是這些結(jié)構(gòu)是一種新的基因組調(diào)控元件郭毕?如果前者是正確的它碎,我們需要發(fā)現(xiàn)控制細(xì)胞核結(jié)構(gòu)形成的獨(dú)立規(guī)則;如果后者是正確的显押,我們則需要研究染色質(zhì)結(jié)構(gòu)所產(chǎn)生的調(diào)控元件扳肛,以增進(jìn)我們對(duì)遺傳密碼在3D核中如何解密和發(fā)揮作用的理解。為了探討這個(gè)問題乘碑,我們概述在哺乳動(dòng)物基因組中關(guān)于基本調(diào)控元件組織原理的一些發(fā)現(xiàn):
單個(gè)染色體被組織在離散的染色體區(qū)域中挖息。
拓?fù)潢P(guān)聯(lián)域(topologically associating domains, TADs)通常在發(fā)育的早期就建立,并且在細(xì)胞類型之間相對(duì)不變兽肤。
干擾TADs結(jié)構(gòu)會(huì)導(dǎo)致基因表達(dá)的改變套腹。
增強(qiáng)子和啟動(dòng)子之間的物理接近可以導(dǎo)致基因激活绪抛。
在基因表達(dá)激活之前,似乎已經(jīng)建立起一些增強(qiáng)子-啟動(dòng)子的相互作用电禀。
一些非膜結(jié)合核區(qū)室(non-membrane-bound nuclear compartments)可以是預(yù)先形成的固定實(shí)體幢码。
在表型正常的個(gè)體中,染色體易位相對(duì)普遍尖飞。
涉及整個(gè)TADs的重排不會(huì)引起基因表達(dá)的變化或只有很小的變化症副。
細(xì)胞核區(qū)室和subTADs在不同細(xì)胞類型之間和不同細(xì)胞中有所不同。
TADs結(jié)構(gòu)的變化和基因表達(dá)的相關(guān)變化是由功能性邊界元件擾動(dòng)所引起的政基。
粘連蛋白(cohesin)和CCCTC結(jié)合因子(CTCF)的耗竭會(huì)導(dǎo)致染色質(zhì)結(jié)構(gòu)發(fā)生根本性變化贞铣,但基因表達(dá)的變化相對(duì)較小。
在基因組的天然組成中沮明,調(diào)控元件之間的物理接近程度取決于結(jié)合在這些元件上的factors辕坝。
某些增強(qiáng)子-啟動(dòng)子的相互作用與基因表達(dá)的上調(diào)同時(shí)發(fā)生。
許多非膜結(jié)合核區(qū)室是動(dòng)態(tài)的瞬時(shí)性結(jié)構(gòu)珊擂。
可以基于染色質(zhì)修飾圣勒、轉(zhuǎn)錄因子(TF)的結(jié)合和基因表達(dá)來預(yù)測TADs。
這些觀察結(jié)果強(qiáng)有力地表明:高級(jí)染色質(zhì)結(jié)構(gòu)是由基因組的調(diào)控元件所編碼的摧扇,并可以作為調(diào)控元件活性的表現(xiàn)形式圣贸。對(duì)于基因組結(jié)構(gòu)和功能之間的關(guān)系,提出了以下模型(見圖):
基因組調(diào)控元件的活性與細(xì)胞核中的TF程序及表觀遺傳程序有關(guān)扛稽。這些調(diào)控元件的序列吁峻、排列和活性共同指導(dǎo)了高級(jí)染色質(zhì)結(jié)構(gòu)形成的基礎(chǔ)過程。結(jié)合CTCF的邊界元件劃定了黏著蛋白所介導(dǎo)的環(huán)擠壓的邊界在张,從而控制了TAD邊界的位置用含。活躍的基因啟動(dòng)子可能以相似的方式起作用帮匾。在TAD中啄骇,環(huán)擠出的過程使增強(qiáng)子和啟動(dòng)子在物理距離上非常接近,這可能會(huì)促進(jìn)特定的增強(qiáng)子-啟動(dòng)子互作瘟斜,并通過其上所結(jié)合的TFs及輔因子之間的親和力實(shí)現(xiàn)更穩(wěn)定的互作缸夹。根據(jù)它們的染色質(zhì)狀態(tài),常染色質(zhì)和異染色質(zhì)區(qū)域通過相分離過程形成空間分隔的區(qū)室螺句。
在未來的工作中虽惭,更詳細(xì)地研究細(xì)胞核區(qū)室化、環(huán)擠壓蛇尚、增強(qiáng)子-啟動(dòng)子相互作用和轉(zhuǎn)錄發(fā)生是如何在單個(gè)細(xì)胞中實(shí)時(shí)動(dòng)態(tài)發(fā)生的將是重要的芽唇。我們期待將超分辨率成像技術(shù)與單細(xì)胞測序技術(shù)相結(jié)合,將有助于解決這些問題取劫,并有助于更好地理解基因調(diào)控匆笤、基因組組織結(jié)構(gòu)及其相互關(guān)系研侣。
參考文獻(xiàn):Oudelaar, A.M., Higgs, D.R. The relationship between genome structure and function.?Nat Rev Genet?(2020). https://doi.org/10.1038/s41576-020-00303-x