人類(lèi)基因組中豐富的遺傳變異不是在蛋白質(zhì)編碼基因中發(fā)現(xiàn)的,而是在非蛋白質(zhì)編碼區(qū)域內(nèi)發(fā)現(xiàn)的鱼辙。鑒于只有1%的基因組編碼蛋白質(zhì)廉嚼,這并不奇怪。直到最近倒戏,確定遺傳變異對(duì)性狀變異和疾病的影響的努力集中于編碼區(qū)域怠噪。然而,全基因組關(guān)聯(lián)研究(GWAS)的結(jié)果表明杜跷,性狀和疾病相關(guān)變體通常是調(diào)節(jié)變體傍念,例如在非編碼區(qū)中發(fā)現(xiàn)的表達(dá)數(shù)量性狀基因座(eQTL)矫夷。這些結(jié)果促使人們努力了解非編碼,監(jiān)管變異的功能作用憋槐。迄今為止的努力依賴(lài)于表征變體和基因表達(dá)之間的關(guān)聯(lián)双藕。然而,這個(gè)協(xié)會(huì)本身就是 不會(huì)揭示非編碼變體影響基因表達(dá)的完整功能機(jī)制阳仔。因此忧陪,最近的努力開(kāi)始表征許多分子表型,例如轉(zhuǎn)錄因子(TF)結(jié)合近范,組蛋白修飾和染色質(zhì)狀態(tài)嘶摊,以確定調(diào)節(jié)變體影響基因表達(dá)的機(jī)制。
一期评矩,四篇論文
在11月8日出版的“科學(xué)”雜志上更卒,發(fā)表了三篇論文,闡述了非編碼遺傳變異對(duì)TF結(jié)合稚照,組蛋白修飾和染色質(zhì)狀態(tài)(即活性與非活性增強(qiáng)子狀態(tài))的作用蹂空。第一項(xiàng)研究由日內(nèi)瓦大學(xué)的Dermitzakis實(shí)驗(yàn)室完成。他們使用染色質(zhì)免疫沉淀和測(cè)序(ChIP-Seq)分析了來(lái)自?xún)蓚€(gè)親子三聯(lián)體的淋巴母細(xì)胞系(LCL)中的三種TF果录,RNA聚合酶II(Pol II)和五種組蛋白修飾[1]上枕。第二個(gè)是由最近搬到斯坦福的Pritchard實(shí)驗(yàn)室和芝加哥大學(xué)的吉拉德實(shí)驗(yàn)室完成的。他們確定了影響四種組蛋白修飾變異的遺傳變異和十種不相關(guān)的約魯巴LCL的Pol II占據(jù)[2]弱恒。第三項(xiàng)研究由斯坦福大學(xué)的斯奈德實(shí)驗(yàn)室完成辨萍。他們使用RNA-Seq和ChIP-Seq對(duì)來(lái)自不同群體的19種LCL中的四種組蛋白修飾和兩種DNA結(jié)合因子的染色質(zhì)狀態(tài)變化的遺傳變異進(jìn)行了表征[3]。這項(xiàng)工作是該研究的第一作者M(jìn)aya Kasowski最近發(fā)表的CEHG Evolgenome演講的主題返弹。最后锈玉,發(fā)表在11月28日出版的“自然”雜志上的第四項(xiàng)研究由加州大學(xué)圣地亞哥分校的玻璃實(shí)驗(yàn)室完成。他們使用ChIP-Seq描述了兩種小鼠品系之間天然遺傳變異對(duì)參與細(xì)胞分化的兩種TF(PU.1和C /EBPα)結(jié)合的影響[4]义起。在這篇文章中拉背,我將主要分析Pritchard Lab提供的工作,但我強(qiáng)烈建議閱讀所有四篇論文默终,以了解表征非編碼變異的挑戰(zhàn)以及可用的方法椅棺。
Motivation
這四項(xiàng)研究旨在回答調(diào)節(jié)變異如何影響基因表達(dá)的一般問(wèn)題。它們表征不同的分子表型齐蔽,如組蛋白修飾和TF結(jié)合两疚,以了解非編碼變體的作用機(jī)制。Pritchard實(shí)驗(yàn)室的研究重點(diǎn)是四種組蛋白修飾(三種活性和一種抑制性:分別為H3K4me3含滴,H3K4me1诱渤,H3K27ac和H3K27me3)和Pol II占據(jù)。
組蛋白修飾101
組蛋白修飾是指向包含核小體的組蛋白的尾部上的特定氨基酸添加化學(xué)基團(tuán)如甲基或乙跆缚觯基勺美。這些化學(xué)基團(tuán)被稱(chēng)為組蛋白標(biāo)記鞋吉。它們可以提供廣泛的功能,但通常它們與染色質(zhì)區(qū)域的可及性相關(guān)励烦。例如谓着,組蛋白3(H3K4me3)的賴(lài)氨酸4的三甲基化與染色質(zhì)可及性和基因活化增加有關(guān)。另一方面坛掠,啟動(dòng)子處抑制標(biāo)記H3K27me3(組蛋白3的賴(lài)氨酸27的三甲基化)水平的增加與基因失活有關(guān)赊锚。
使用ChIP-Seq以高通量方式測(cè)量組蛋白標(biāo)記水平。簡(jiǎn)而言之屉栓,靶向目標(biāo)標(biāo)記的抗體用于下調(diào)修飾的基因組區(qū)域舷蒲。然后對(duì)這些免疫沉淀區(qū)域進(jìn)行測(cè)序以確定哪些基因組區(qū)段被修飾以及在何種水平上。該過(guò)程通常需要大量的細(xì)胞(大約10 ^ 7)友多。因此牲平,修飾水平在某種程度上是群體水平測(cè)量。對(duì)ChIP-Seq數(shù)據(jù)的分析通常涉及測(cè)試具有比預(yù)期偶然更多讀數(shù)的基因組區(qū)域域滥。這些區(qū)域的范圍從200bp到1000bp或更多纵柿,被稱(chēng)為代表高于基因組背景的修飾水平的峰。像H3K27me3這樣的抑制性標(biāo)記傾向于具有寬峰區(qū)域启绰,而像H3K4me3這樣的激活標(biāo)記可以具有更緊密的峰值昂儒。
由于修飾水平代表對(duì)細(xì)胞群的測(cè)量,并且組蛋白殘基可具有多個(gè)修飾委可,因此基因組區(qū)域可顯示多個(gè)標(biāo)記的證據(jù)渊跋。這些標(biāo)記在區(qū)域上的組合可以標(biāo)記該區(qū)域的功能。例如着倾,具有高水平的H3K27ac和高比率的H3K4me1與H3K4me3的區(qū)域可以標(biāo)記活性增強(qiáng)子區(qū)域拾酝。到目前為止,這些標(biāo)記在個(gè)體之間的變異與這種變異的遺傳原因尚未被描述卡者。此外蒿囤,這些商標(biāo)的因果影響仍然未知。他們是直接改變基因表達(dá)還是通過(guò)基因調(diào)控改變它們虎眨?因此蟋软,本研究的兩個(gè)指導(dǎo)性問(wèn)題是:
1.哪些遺傳變異影響組蛋白修飾镶摘?
2.這些修飾是“基因調(diào)控的原因還是后果嗽桩?”
組蛋白修飾的變異,一個(gè)真正的whodunit
作者首先尋求識(shí)別和表征影響組蛋白標(biāo)記的遺傳變異凄敢。他們生成了四個(gè)組蛋白標(biāo)記的ChIP-Seq數(shù)據(jù)和來(lái)自十個(gè)不相關(guān)的約魯巴個(gè)體的LCL中的Pol II碌冶,這些個(gè)體先前被基因分類(lèi)為1000個(gè)基因組項(xiàng)目的一部分。對(duì)諸如eQTL研究等調(diào)節(jié)變體的類(lèi)似研究需要大樣本量來(lái)檢測(cè)通常位于基因之外的調(diào)節(jié)變體的影響涝缝。與eQTL研究不同扑庞,組蛋白標(biāo)記覆蓋相當(dāng)廣泛的區(qū)域譬重,通常包含因果調(diào)節(jié)變異。因此罐氨,作者可以使用較小的樣本量臀规,并仍然有信心詢(xún)問(wèn)因果調(diào)節(jié)SNP的影響。作者開(kāi)發(fā)了一項(xiàng)統(tǒng)計(jì)檢驗(yàn)栅隐,模擬個(gè)體之間的總閱讀深度和個(gè)體內(nèi)單倍型之間的等位基因失衡塔嬉,以增加檢測(cè)順式QTL的能力(即影響組蛋白標(biāo)記的變異和基因組附近的Pol II占據(jù))。使用這種方法租悄,他們確定了超過(guò)1200個(gè)不同的QTL谨究,用于組蛋白標(biāo)記和Pol II占用(FDR 20%)。
然后泣棋,作者分析這些組蛋白標(biāo)記和Pol II QTL以確定這些變體與其他已知調(diào)節(jié)變體的重疊胶哲。假設(shè)是影響基因表達(dá)的調(diào)節(jié)變體將對(duì)不同的分子表型產(chǎn)生影響。因此潭辈,影響組蛋白標(biāo)記和Pol II的變體應(yīng)顯示與已知調(diào)節(jié)變體(例如eQTL和DNase I靈敏度QTL(dsQTL))的顯著重疊鸯屿。DNase I靈敏度是染色質(zhì)可及性的量度,具有更高的靈敏度把敢,與更高的可及性相關(guān)碾盟。在之前的兩項(xiàng)研究中,Pritchard實(shí)驗(yàn)室在大約75個(gè)Yoruban LCL樣本中繪制了eQTL和dsQTL技竟,我也建議閱讀[5,6]冰肴。他們的分析揭示了dsQTL的低p值的富集,并且在較小程度上榔组,當(dāng)作為組蛋白標(biāo)記和Pol II QTL測(cè)試時(shí)熙尉,eQTL被富集。此外搓扯,作者觀察到dsQTL和eQTL的多種分子表型的協(xié)調(diào)變化检痰。例如,對(duì)于更多DNase I敏感基因型锨推,在dsQTL處觀察到更高水平的三種組蛋白活性標(biāo)記铅歼。在eQTLs,具有高表達(dá)基因型的個(gè)體的H3K4me3换可,H3K27ac和Pol II水平更高椎椰。這些結(jié)果表明,非編碼調(diào)節(jié)變體影響多種分子表型沾鳄,范圍從染色質(zhì)可及性和轉(zhuǎn)錄到組蛋白修飾慨飘。作者提供了強(qiáng)有力的證據(jù)來(lái)回應(yīng)他們的第一個(gè)指導(dǎo)性問(wèn)題,即非編碼調(diào)控多態(tài)性與組蛋白標(biāo)記和Pol II的變異相關(guān)。對(duì)于更多的DNase I敏感基因型瓤的,在dsQTL處觀察到更高水平的三種組蛋白活性標(biāo)記休弃。在eQTLs,具有高表達(dá)基因型的個(gè)體的H3K4me3圈膏,H3K27ac和Pol II水平更高塔猾。這些結(jié)果表明,非編碼調(diào)節(jié)變體影響多種分子表型稽坤,范圍從染色質(zhì)可及性和轉(zhuǎn)錄到組蛋白修飾桥帆。作者提供了強(qiáng)有力的證據(jù)來(lái)回應(yīng)他們的第一個(gè)指導(dǎo)性問(wèn)題,即非編碼調(diào)控多態(tài)性與組蛋白標(biāo)記和Pol II的變異相關(guān)慎皱。對(duì)于更多的DNase I敏感基因型老虫,在dsQTL處觀察到更高水平的三種組蛋白活性標(biāo)記。在eQTLs茫多,具有高表達(dá)基因型的個(gè)體的H3K4me3祈匙,H3K27ac和Pol II水平更高。這些結(jié)果表明天揖,非編碼調(diào)節(jié)變體影響多種分子表型夺欲,范圍從染色質(zhì)可及性和轉(zhuǎn)錄到組蛋白修飾。作者提供了強(qiáng)有力的證據(jù)來(lái)回應(yīng)他們的第一個(gè)指導(dǎo)性問(wèn)題今膊,即非編碼調(diào)控多態(tài)性與組蛋白標(biāo)記和Pol II的變異相關(guān)些阅。這些結(jié)果表明,非編碼調(diào)節(jié)變體影響多種分子表型斑唬,范圍從染色質(zhì)可及性和轉(zhuǎn)錄到組蛋白修飾市埋。作者提供了強(qiáng)有力的證據(jù)來(lái)回應(yīng)他們的第一個(gè)指導(dǎo)性問(wèn)題,即非編碼調(diào)控多態(tài)性與組蛋白標(biāo)記和Pol II的變異相關(guān)恕刘。這些結(jié)果表明缤谎,非編碼調(diào)節(jié)變體影響多種分子表型,范圍從染色質(zhì)可及性和轉(zhuǎn)錄到組蛋白修飾褐着。作者提供了強(qiáng)有力的證據(jù)來(lái)回應(yīng)他們的第一個(gè)指導(dǎo)性問(wèn)題坷澡,即非編碼調(diào)控多態(tài)性與組蛋白標(biāo)記和Pol II的變異相關(guān)。
TF和方向性問(wèn)題
然后含蓉,作者轉(zhuǎn)而解決這些商標(biāo)的因果關(guān)系問(wèn)題频敛。為此,他們分析了TF結(jié)合位點(diǎn)的遺傳變異馅扣。主要假設(shè)是改變TFBS的調(diào)節(jié)變體將修飾TF結(jié)合斟赚,這將導(dǎo)致附近的組蛋白標(biāo)記和Pol II水平的變化。如果是這種情況岂嗓,那么組蛋白標(biāo)記的變化是TF結(jié)合位點(diǎn)強(qiáng)度的結(jié)果汁展。另一方面,如果這些標(biāo)記是因果關(guān)系厌殉,則不期望TF結(jié)合位點(diǎn)的多態(tài)性與這些標(biāo)記的變化顯示出強(qiáng)烈的相關(guān)性食绿。
為了驗(yàn)證他們的假設(shè),作者檢查了~11.5K TF結(jié)合位點(diǎn)公罕,其10個(gè)個(gè)體中至少有1個(gè)具有雜合子多態(tài)性器紧。他們計(jì)算每個(gè)個(gè)體內(nèi)多態(tài)性TF結(jié)合位點(diǎn)的兩個(gè)等位基因之間的位置權(quán)重矩陣(PWM)得分的變化。然后楼眷,他們測(cè)試PWM的這種變化與附近雜合位點(diǎn)的ChIP-Seq讀數(shù)的等位基因失衡之間的顯著關(guān)聯(lián)铲汪。該想法是,如果變體改善(或破壞)TF結(jié)合位點(diǎn)處的一個(gè)等位基因的TF結(jié)合罐柳,則相同等位基因附近的活性組蛋白標(biāo)記將增加(或減少)掌腰。抑制性組蛋白標(biāo)記(在本例中為H3K27me3)預(yù)計(jì)會(huì)產(chǎn)生相反的反應(yīng)。實(shí)際上张吉,當(dāng)他們應(yīng)用他們的測(cè)試時(shí)齿梁,他們發(fā)現(xiàn)活躍標(biāo)記與抑制標(biāo)記的負(fù)相關(guān)顯著正相關(guān)。該結(jié)果支持由于TF結(jié)合和基因調(diào)節(jié)而改變組蛋白標(biāo)記的假設(shè)肮蛹。但是勺择,這個(gè)結(jié)果并不排除其他可能性。組蛋白標(biāo)記仍然可以在TF結(jié)合的建立中起到因果作用伦忠。換句話說(shuō)省核,TF結(jié)合和組蛋白標(biāo)記之間的關(guān)系不必是單向的。此外昆码,有證據(jù)表明長(zhǎng)的非編碼RNA可能在組蛋白標(biāo)記的建立和調(diào)節(jié)中起作用气忠。
dsQTL和eQTL,染色質(zhì)上的匹配
在他們的最終分析中赋咽,作者研究了同樣是eQTL的dsQTL笔刹。由于這些變體與遠(yuǎn)端調(diào)節(jié)區(qū)域的基因表達(dá)和染色質(zhì)可及性相關(guān)(距離相關(guān)TSS> 5kb),因此作者可以將調(diào)節(jié)區(qū)域指定給特定基因冬耿。同時(shí)存在dsQTL和eQTL的變體可能破壞遠(yuǎn)端調(diào)節(jié)區(qū)域舌菜。除了破壞調(diào)節(jié)區(qū)的可及性之外,該變體還擾亂受調(diào)節(jié)區(qū)影響的基因的表達(dá)亦镶。例如日月,變體可以降低增強(qiáng)子區(qū)域的染色質(zhì)可及性,從而降低增強(qiáng)子的活性組蛋白標(biāo)記水平缤骨。這種降低的增強(qiáng)子活性可導(dǎo)致附近基因的轉(zhuǎn)錄減少爱咬,并且同樣降低該基因的活性標(biāo)記水平。因此绊起,指導(dǎo)該分析的假設(shè)是精拟,影響遠(yuǎn)端調(diào)節(jié)區(qū)域的組蛋白標(biāo)記的變體將對(duì)調(diào)節(jié)區(qū)域控制下的基因的組蛋白標(biāo)記具有協(xié)同作用。作者檢查了調(diào)控區(qū)域及其相關(guān)轉(zhuǎn)錄起始位點(diǎn)(TSS)中ChIP-Seq讀數(shù)的等位基因失衡。實(shí)際上蜂绎,作者觀察到增加DNase I敏感性的變體在調(diào)節(jié)區(qū)和TSS的活性標(biāo)記上具有顯著的陽(yáng)性等位基因不平衡栅表。壓制商標(biāo)的情況恰恰相反。該結(jié)果再次強(qiáng)調(diào)了基因調(diào)控的復(fù)雜性和非編碼變異的影響师枣。調(diào)節(jié)變體不僅影響附近的不同分子表型怪瓶,它們還可以指導(dǎo)遠(yuǎn)端基因座的變化。正如作者所說(shuō)践美,遠(yuǎn)端區(qū)域之間組蛋白標(biāo)記的這種協(xié)調(diào)變化可能反映了染色質(zhì)的3D組織洗贰。影響遠(yuǎn)端調(diào)節(jié)區(qū)域和基因之間染色質(zhì)環(huán)狀相互作用的調(diào)節(jié)變體可能導(dǎo)致基因和調(diào)節(jié)區(qū)域的活性水平發(fā)生變化。
結(jié)論
本文提供了明確的證據(jù)陨倡,表明調(diào)節(jié)變異具有非常復(fù)雜的影響敛滋,同時(shí)影響多個(gè)區(qū)域的多種多樣的分子表型。這種復(fù)雜性意味著調(diào)節(jié)變體作用于基因調(diào)控的潛在多種多樣的機(jī)制兴革。作者開(kāi)始尋找這些機(jī)制之一的證據(jù)绎晃,即TF結(jié)合位點(diǎn)的擾動(dòng)。他們首先表明組蛋白修飾的變異具有強(qiáng)烈的遺傳基礎(chǔ)帖旨,并且影響這些標(biāo)記的多態(tài)性與已知的調(diào)節(jié)變體如eQTL重疊箕昭。然后,他們表明TF結(jié)合位點(diǎn)的多態(tài)性與組蛋白標(biāo)記的變化相關(guān)解阅,為這些標(biāo)記與基因調(diào)控之間的關(guān)系提供了方向性的證據(jù)落竹。在本質(zhì)上,他們的結(jié)果表明货抄,組蛋白修飾至少部分地通過(guò)TF結(jié)合進(jìn)行述召。最后,他們發(fā)現(xiàn)調(diào)節(jié)變異可能對(duì)遠(yuǎn)端區(qū)域的分子表型產(chǎn)生影響蟹地。
我發(fā)現(xiàn)這篇論文以及前面提到的其他三篇文章都非常有趣积暖。我認(rèn)為這些論文表明我們對(duì)基因調(diào)控的理解仍然非常簡(jiǎn)單。隨著ChIP-Seq和DNase-Seq等高通量分子檢測(cè)的出現(xiàn)怪与,我們可以開(kāi)始詢(xún)問(wèn)調(diào)節(jié)變異對(duì)許多表型的復(fù)雜作用夺刑。在這樣做時(shí),提出有關(guān)方向性的問(wèn)題是最主要的分别。一組給定的分子表型如何相關(guān)遍愿?這些表型是否代表基因組功能的原因或結(jié)果?基因調(diào)控的不同元素如何共同構(gòu)建復(fù)雜的表型耘斩?