研究背景:
1.全基因組關(guān)聯(lián)研究(GWAS)已經(jīng)發(fā)現(xiàn)了數(shù)千種與人類疾病和表型性狀相關(guān)的遺傳變異弧圆,但這些遺傳變異的分子機(jī)制一直沒有解開霹期,因?yàn)樗鼈兇蠖嗍俏挥诜蔷幋a區(qū)历造,缺乏明確的功能注釋。最近的研究表明臣淤,這些非編碼變異常以順式調(diào)節(jié)元件(cREs)的染色質(zhì)標(biāo)記為特征,從而導(dǎo)致一種假設(shè)医吊,即相當(dāng)一部分變異可能通過影響轉(zhuǎn)錄調(diào)節(jié)而起作用遮咖。為了驗(yàn)證這一假設(shè)御吞,在人類基因組中定義cREs的靶基因至關(guān)重要陶珠。 因此享钞,這些非編碼的cREs是如何調(diào)節(jié)基因表達(dá)以及如何影響人類疾病的發(fā)生暑脆,就變成了一個(gè)非常有意思的研究方向添吗。
?2.由三維基因組的發(fā)展我們可知染色質(zhì)纖維被折疊成一個(gè)高階結(jié)構(gòu)碟联,在這種結(jié)構(gòu)中鲤孵,線性距離遠(yuǎn)的基因在空間結(jié)構(gòu)上可能很近普监,因此,定位DNA之間的空間接觸有可能揭示cREs的靶基因。
研究技術(shù):
promoter capture Hi-C(pcHi-C)應(yīng)用于27種人類組織or細(xì)胞
主要結(jié)果:
1.數(shù)據(jù)可重復(fù)性強(qiáng)夺饲,且與in situ Hi-C相比擂找,能夠捕獲到相似地結(jié)構(gòu)
2.由染色質(zhì)相互作用圖譜慢洋,根據(jù)先前描述的每個(gè)組織/細(xì)胞類型26中的H3K27ac信號為17295個(gè)啟動子定義了70329個(gè)cREs隘马,推測其調(diào)控的靶基因讳嘱。每個(gè)啟動子平均分配給25個(gè)cREs沥潭,45%的cREs分配給一個(gè)候選靶基因呼渣。
??? 我們利用為相同組織/細(xì)胞類型收集的現(xiàn)有染色質(zhì)數(shù)據(jù)集屁置,評估cREs和目標(biāo)啟動子之間染色質(zhì)狀態(tài)的關(guān)系。如所料使鹅,與多個(gè)啟動子廣泛相互作用的片段通常出現(xiàn)在活性染色質(zhì)區(qū)域,例如轉(zhuǎn)錄因子(TF)結(jié)合簇或超增強(qiáng)子區(qū)域侨艾。
??? 此外茬故,與ChromHMM模型的綜合分析表明,活性啟動子與含有活性增強(qiáng)子的DNA片段的相互作用比二價(jià)啟動子頻繁三倍(圖1c)琅攘。然而剧辐,二價(jià)啟動子與多克隆阻遏復(fù)合物相關(guān)的基因組區(qū)域的相互作用比活性啟動子頻繁5倍(圖1c)。基于5個(gè)細(xì)胞系的50染色質(zhì)狀態(tài)ChromHMM模型的進(jìn)一步分析也支持我們的結(jié)論(補(bǔ)充圖6)鳄梅。
3.以啟動子為中心的染色質(zhì)相互作用包含了相應(yīng)細(xì)胞/組織類型中每個(gè)啟動子的調(diào)控相互作用的信息未檩。有三個(gè)證據(jù)可證明戴尸,如下
(1)我們將啟動子處的染色質(zhì)相互作用與GTEx consortium最近報(bào)道的14種匹配的組織類型(圖2a和補(bǔ)充圖7a-c)中的表達(dá)數(shù)量性狀位點(diǎn)(eQTL)推斷的調(diào)控關(guān)系進(jìn)行了比較。對于每種組織和細(xì)胞類型冤狡,先前報(bào)告的eQTL在相應(yīng)組織中鑒定的染色質(zhì)相互作用中高度富集孙蒙,富集程度高達(dá)5倍(卵巢)。
P–O pcHi-C染色質(zhì)相互作用共檢測到42627個(gè)eQTL關(guān)聯(lián)筒溃,而在控制了線性基因組距離后马篮,只有21362個(gè)eQTL關(guān)聯(lián)是random chance。(PS:隨機(jī)的?什么意思怜奖?)
(2)第二浑测,cREs的活性與多個(gè)組織和細(xì)胞類型的指定候選靶基因表達(dá)之間存在顯著的相關(guān)性,這與我們所理解的調(diào)控關(guān)系一致。具體而言迁央,這些cREs中的H3K27ac水平與這些組織/細(xì)胞類型中的啟動子H3K27ac水平(補(bǔ)充圖8a)和預(yù)測目標(biāo)基因的轉(zhuǎn)錄水平(補(bǔ)充圖8b)顯著相關(guān)掷匠。例如,POU3F3表達(dá)(圖2b中的第二列)與遠(yuǎn)端cRE中的H3K27ac信號高度相關(guān)(圖2b中的第一列)通過組織特異性染色質(zhì)相互作用連接(圖2b中的最后一列)岖圈。
(3)最后讹语,通過pcHi-C相互作用連接捕獲到的細(xì)胞/組織特異性cRE-啟動子對與active cRE和同一細(xì)胞/組織類型的特異性基因顯著相關(guān)。例如蜂科,海馬特異性cRE-啟動子-染色質(zhì)相互作用與海馬中的活性cREs(圖2c)和高表達(dá)基因顯著相關(guān)顽决,盡管關(guān)系不大(補(bǔ)充圖8c)。(我:就是說正是)
活性cREs中的細(xì)胞/組織特異性pcHi-C相互作用和高表達(dá)基因在其他細(xì)胞/組織類型中也有顯著關(guān)聯(lián)(圖2d-f才菠;見方法)。
綜上所述贡定,上述結(jié)果有力地表明赋访,預(yù)測的cRE-啟動子對可以揭示不同組織和細(xì)胞類型中cRE和靶基因之間的調(diào)節(jié)關(guān)系。
4.廣泛的啟動子-啟動子(P-P)相互作用已在培養(yǎng)的哺乳動物細(xì)胞和一些原代組織中被報(bào)道缓待。從27種不同的組織和細(xì)胞類型中獲得的以啟動子為中心的相互作用圖譜使我們能夠測試這是否是一種普遍現(xiàn)象蚓耽。事實(shí)上,與之前的報(bào)告一致旋炒,在兩個(gè)啟動子之間發(fā)現(xiàn)了染色質(zhì)相互作用的顯著部分(9%步悠,n=79989,F(xiàn)isher精確檢驗(yàn)P<2.2×10-16国葬,補(bǔ)充圖9a)贤徒。這些啟動子的物理鄰近性伴隨著啟動子-啟動子之間在不同細(xì)胞/組織類型之間的染色質(zhì)修飾狀態(tài)的顯著高相關(guān)性(圖3a,b)汇四。
5.以前背苦,有幾個(gè)啟動子位點(diǎn)被證明是調(diào)節(jié)遠(yuǎn)端基因的增強(qiáng)子互捌。為支持本研究中所鑒定的類似增功能的啟動子,6127個(gè)eQTL與P-P相互作用對相匹配行剂,而只有2722個(gè)eQTL是random chance(圖3c秕噪,補(bǔ)充圖9b-d和補(bǔ)充表13和14;見方法)厚宰。例如腌巾,在DACT3和AP2S1啟動子區(qū)域之間發(fā)現(xiàn)強(qiáng)烈的染色質(zhì)相互作用遂填,DACT3的一個(gè)顯著eQTLrs78730097(NC_)位于背外側(cè)前額葉皮質(zhì)的AP2S1啟動子中(補(bǔ)充圖10a)。值得注意的是澈蝙,這個(gè)eQTL沒有顯示出與鄰近下游基因(AP2S1)或鄰近基因的任何有意義的遺傳關(guān)聯(lián)吓坚,僅與DACT3相關(guān)(補(bǔ)充圖10b),表明AP2S1啟動子區(qū)域具有調(diào)節(jié)遠(yuǎn)端DACT3啟動子基因表達(dá)的作用灯荧。
為了驗(yàn)證類增強(qiáng)子功能的啟動子,舉一個(gè)例子撕贞,ARIH2OS核心啟動子的缺失導(dǎo)致遠(yuǎn)端靶基因(FDR調(diào)節(jié)P=0.02)的顯著下調(diào)更耻,NCKIPSD通過染色質(zhì)的長程相互作用(圖3d)確定,對鄰近基因沒有顯著或中度影響(補(bǔ)充圖10e)捏膨。
重要的是,在轉(zhuǎn)錄起始位點(diǎn)附近的選定eQTL中食侮,sgRNA誘導(dǎo)的突變對遠(yuǎn)端靶基因有顯著的下調(diào)作用号涯,但對H1-hESC中的鄰近基因表達(dá)沒有顯著影響(圖3e,補(bǔ)充圖10f和補(bǔ)充表16锯七;見方法)
我們的研究結(jié)果證明了人類基因組中存在著類似增強(qiáng)子功能的啟動子链快,并進(jìn)一步揭示了它們在遠(yuǎn)端基因調(diào)控中的功能。
6.以啟動子為中心的染色質(zhì)相互作用圖譜使我們能夠推斷出含有疾病相關(guān)變異體序列的靶基因眉尸,并理解人類疾病的分子基礎(chǔ)域蜗。我們的研究重點(diǎn)是從公開的GWAS數(shù)據(jù)42633個(gè)與疾病/性狀相關(guān)的遺傳變異,30%SNPs在cREs中被發(fā)現(xiàn)噪猾,這強(qiáng)調(diào)了cREs靶基因鑒定在疾病相關(guān)遺傳變異的功能解釋中的重要性霉祸。由于在大多數(shù)情況下,SNP功能是未知的袱蜡,包括位于先前定義的cREs之外的SNP丝蹭,我們能夠?yàn)?7325個(gè)SNP分配靶基因。平均而言坪蚁,每個(gè)SNP被分配到每種細(xì)胞/組織類型中的1到3個(gè)候選靶基因之間奔穿,但需要注意的是,靶基因的精確數(shù)量可能會受到啟動子捕獲策略的適度分辨率和組織樣本的異質(zhì)性的影響(補(bǔ)充圖11a和補(bǔ)充表17敏晤;見方法)贱田。因此,與單獨(dú)使用最近鄰基因預(yù)測相比嘴脾,上述圖譜提供了更多的疾病相關(guān)基因預(yù)測(補(bǔ)充圖11b男摧,c中提供了帕金森病的一個(gè)例子),從我們以啟動子為中心的染色質(zhì)相互作用圖譜中推斷出的假定靶基因中只有8%被發(fā)現(xiàn)是最接近序列變體的基因(補(bǔ)充圖11d)。
為了評估基于啟動子中心染色質(zhì)相互作用圖譜的靶點(diǎn)預(yù)測的有效性彩倚,我們重點(diǎn)研究了7個(gè)GWAS變異筹我,它們與人類淋巴母細(xì)胞系GM12878中先前注釋的cREs和eQTLs重疊。我們使用CRISPR-Cas9基因組編輯工具在GM12878細(xì)胞中引入這些元素的缺失帆离,并使用逆轉(zhuǎn)錄定量PCR(RT-qPCR)在突變細(xì)胞和對照細(xì)胞中檢測預(yù)測目標(biāo)基因的表達(dá)蔬蕊。有5個(gè)表達(dá)都下調(diào)。
7.許多疾病和性狀可能存在相同的分子通路哥谷,那么這些共同的分子通路的識別有助于了解疾病的發(fā)病機(jī)制和開展治療岸夯。為了揭示不同疾病和生理特征背后的共同分子通路,我們首先基于各自的GWAS associated SNP確定了這些疾病/特征共有的靶基因们妥。我們將687個(gè)性狀和疾病分為40組(圖4b猜扮、補(bǔ)充圖12a-c和補(bǔ)充表19;見方法)监婶。
這種分組多虧了pcHi-C的靶基因的預(yù)測,因?yàn)榛贕WAS SNP或者GWAS SNP臨近基因來分組的話相似性不明顯带污,研究表明僵控,GWAS中靶基因的預(yù)測對于我們分析性狀之間關(guān)聯(lián)也有幫助。
為了進(jìn)一步了解人類各種疾病中常見的分子通路鱼冀,我們對每個(gè)簇內(nèi)GWAS-SNPs的預(yù)測的靶基因進(jìn)行了基因本體GO分析(補(bǔ)充表20报破;見方法)。GO分析表明千绪,每個(gè)簇中(疾病和性狀類型)存在潛在的共享的分子通路(圖4e充易,補(bǔ)充圖12e和補(bǔ)充表21),也存在特定性狀之間的意外聯(lián)系翘紊。例如蔽氨,C39暴露了感染性疾病和自身免疫性疾病的易感性與卡鉑和順鉑的化療毒性風(fēng)險(xiǎn)之間的聯(lián)系。為了支持這種聯(lián)系帆疟,一個(gè)與卡鉑和順鉑反應(yīng)相關(guān)的假定靶基因是ABCF1鹉究,它參與炎癥反應(yīng)。盡管這些是推測踪宠,但文章中分析揭示了共同的分子途徑可能為研究復(fù)雜性狀和疾病表型的分子機(jī)制提供新的線索自赔。
結(jié)論部分:
總之,我們已經(jīng)在不同的人類細(xì)胞/組織類型中生成了以啟動子為中心的染色質(zhì)相互作用圖譜柳琢。我們的分析涵蓋了廣泛的人類組織類型绍妨,為70000個(gè)推測的cREs和27000GWAS SNP變異提供了靶基因預(yù)測润脸。這一資源使我們能夠系統(tǒng)地了解在不同疾病和性狀中失調(diào)的分子通路。在未來的研究中他去,通過比較我們的參考染色質(zhì)相互作用圖來分析疾病特異的染色質(zhì)與臨床樣本的相互作用毙驯,可以大大提高對許多疾病和性狀相關(guān)的遺傳變異的功能解釋。應(yīng)當(dāng)指出的是灾测,目前的研究只調(diào)查了有限數(shù)量的人類組織和細(xì)胞類型爆价,并為人類基因組中注釋的一小部分假定cREs指定了靶基因。然而媳搪,這一資源為進(jìn)一步了解人類疾病的發(fā)病機(jī)制和開發(fā)新的治療策略奠定了基礎(chǔ)铭段。
summary
疾病的發(fā)生與多種因素有關(guān),找根源一般都會與某些基因的表達(dá)異常有關(guān)秦爆,那么出現(xiàn)表達(dá)異承蛴蓿基因的因素一般是發(fā)生在調(diào)控區(qū),淺顯的說等限,也許是該基因的啟動子序列出現(xiàn)突變爸吮,導(dǎo)致不能表達(dá),也可能是發(fā)生了表觀層面的變化望门。在上一層次可能會受到其他元件的調(diào)控拗胜,比如增強(qiáng)子等,那么增強(qiáng)子的調(diào)控的遺傳也會引起基因表達(dá)的變化怒允,總之一句話就是說我們目前發(fā)現(xiàn)的疾病相關(guān)的遺傳變異大都發(fā)生在cREs,因此我們找到cREs調(diào)控的靶基因锈遥,再了解其具體牽扯到哪些通路中纫事,引起了哪些的異常對于我們的疾病治療有所幫助。
文章中提到eQTL所灸,什么意思呢丽惶,GWAS分析出與某性狀相關(guān)的SNP,但該SNP不一定就導(dǎo)致功能的變化爬立,如果該SNP沒有引起表達(dá)量的變化钾唬,可能不會影響疾病,eQTL是與單個(gè)基因表達(dá)量相關(guān)的DNA突變侠驯,文章中開始將pcHi-c和eQTL一起進(jìn)行比較抡秆,兩個(gè)互補(bǔ)充有助于深入理解高級染色質(zhì)結(jié)構(gòu)與基因表達(dá)調(diào)控的影響。(是這樣嗎 自己理解的 對eQTL還不太熟悉)
初讀