標(biāo)題:chromatin and gene-regulatory dynamics of the developing human cerebral cortex at single-cell resolution
發(fā)表時間:2021年8月
發(fā)表期刊:cell
研究材料:
scATAC :共13個樣本遂蛀,年齡從pcw16 pcw20 pcw21 cw24四個時期(每個樣本都有重復(fù))
scRNA:8個樣本嫉父,也是4個時期(每個樣本有重復(fù))
Multiome:3個樣本 pcw 21九杂,1個時期心肪,三個重復(fù)
采樣部位:大腦皮質(zhì)(未找到大腦皮質(zhì)哪一具體部位)
細(xì)胞數(shù):scATAC-seq為31304個凳兵,scRNA-seq為57868個犬耻。(這是質(zhì)控后的細(xì)胞數(shù)站削,原始scATAC細(xì)胞數(shù)為40512個弊知,scRNA為62715)scATAC過濾掉的細(xì)胞數(shù)還是更多的
文章摘要:
大腦皮質(zhì)發(fā)育的遺傳擾動可導(dǎo)致神經(jīng)發(fā)育疾病,其中包括自閉癥(ASD)容诬。為了確定對皮質(zhì)發(fā)生至關(guān)重要的基因組區(qū)域娩梨,作者繪制了gene-regulatory elements 的活性,獨立地和聯(lián)合地生成了基因表達(dá)和染色質(zhì)可及性的單細(xì)胞圖譜览徒。
揭示了關(guān)鍵轉(zhuǎn)錄因子 (TF) 在幾乎連續(xù)的分化軌跡上的基因調(diào)控變化狈定,區(qū)分了神經(jīng)膠質(zhì)譜系的表達(dá)程序,并確定了譜系決定 TF习蓬,這些 TF 在關(guān)聯(lián)的基因調(diào)控元件和表達(dá)水平之間表現(xiàn)出強相關(guān)性纽什。這些高度聯(lián)系的基因在早期分化細(xì)胞中染色質(zhì)狀態(tài)是活躍的,與譜系承擔(dān)的一致躲叼。
堿基對分辨神經(jīng)網(wǎng)絡(luò)模型(Base-pair-resolution neural network models)確定了在一個ASD群體中預(yù)測為破壞性的非編碼突變的強細(xì)胞類型特異性富集芦缰,并確定了頻繁破壞的TF結(jié)合位點。這種方法說明了細(xì)胞類型特異性映射如何為人類發(fā)育和疾病的控制提供見解枫慷。
INTRODUCTION:
由轉(zhuǎn)錄因子(TF)結(jié)合變化驅(qū)動的順式調(diào)控DNA元件活性的動態(tài)變化让蕾,是發(fā)育過程中表型轉(zhuǎn)化的基礎(chǔ)。測量染色質(zhì)可及性的單細(xì)胞方法已成為該活性的敏感方法或听,并與測量單細(xì)胞轉(zhuǎn)錄組的工具相結(jié)合探孝,具有破譯TFs組合如何驅(qū)動基因表達(dá)程序的潛力。量化調(diào)控元件的動態(tài)活性還可以推斷疾病相關(guān)遺傳變異影響發(fā)育的時間點或細(xì)胞類型誉裆。例如顿颅,與自閉癥譜系障礙(ASD)相關(guān)的遺傳變異如何與大腦皮層發(fā)育的遺傳程序相互作用,目前尚不清楚足丢。
皮質(zhì)生成是一個動態(tài)的粱腻、高度調(diào)節(jié)的過程,其特征是腦心室和室下區(qū)(VZ斩跌、SVZ)的apical and basal radial glia(RG)和中間祖細(xì)胞( intermediate progenitors)的擴(kuò)張绍些,即谷氨酸能神經(jīng)元(glutamatergic neurons)的內(nèi)向外生成,星形膠質(zhì)細(xì)胞和少突膠質(zhì)細(xì)胞的分化來源于背側(cè)前腦以外的細(xì)胞類型滔驶,包括GABA能神經(jīng)元遇革、小膠質(zhì)細(xì)胞和一些少突膠質(zhì)細(xì)胞,也遷移并整合到皮質(zhì)中。解決與這些發(fā)育軌跡相關(guān)的基因調(diào)控動力學(xué)需要在單細(xì)胞分辨率下研究染色質(zhì)和基因表達(dá)狀態(tài)萝快。
為了繪制人類皮質(zhì)發(fā)生的基因調(diào)控邏輯锻霎,我們從妊娠中期8周的人類胎兒皮質(zhì)樣本中生成了單細(xì)胞染色質(zhì)可及性和RNA表達(dá)譜。這些成對的圖譜揭示了一類基因揪漩,其附近有相對大量的putative enhancers旋恼,這些增強子的可及性對基因表達(dá)有強烈的預(yù)測作用。這些具有預(yù)測染色質(zhì)(GPCs:genes with predictive chromatin)的基因通常是TFs奄容,我們觀察到它們的局部可及性先于循環(huán)祖細(xì)胞( cycling progenitors)中的譜系特異性基因表達(dá)冰更。我們使用來自同一細(xì)胞的單細(xì)胞可及性和表達(dá)譜(多組學(xué))驗證了這些發(fā)現(xiàn)。
我們定義了皮質(zhì)谷氨酸能神經(jīng)元(glutamatergic neurons)的發(fā)育軌跡昂勒,揭示了與神經(jīng)元特異性和遷移相關(guān)的TF motif 活性的持續(xù)進(jìn)展蜀细,并探索了TF motif 可及性沿此軌跡的相關(guān)性。此外戈盈,我們還鑒定了膠質(zhì)祖細(xì)胞(glial progenitors)的譜系潛能奠衔,并為兩種不同的星形膠質(zhì)細(xì)胞前體亞型提供了證據(jù)。
最后塘娶,我們訓(xùn)練了一個深度學(xué)習(xí)模型归斤,從DNA序列推斷堿基對解析、細(xì)胞類型特異性染色質(zhì)可及性圖譜刁岸。這些模型可以預(yù)測遺傳變異對細(xì)胞類型特異性染色質(zhì)景觀的潛在影響脏里,并優(yōu)先考慮與ASD相關(guān)的罕見新發(fā)遺傳變異,證明在皮質(zhì)發(fā)育過程中利用單細(xì)胞和單堿基分辨率繪制疾病風(fēng)險圖的能力虹曙。
DISCUSSION
在這里迫横,我們生成了皮質(zhì)發(fā)育關(guān)鍵時期的成對轉(zhuǎn)錄組和表觀基因組圖譜,并描述了DNA結(jié)合因子和順式調(diào)節(jié)元件之間的分子相互作用如何調(diào)節(jié)基因表達(dá)程序酝碳。此外员淫,我們還描述了rare noncoding, de novo mutations如何破壞這種邏輯。
我們鑒定了一組基因(GPC)击敌,這些基因富集譜系決定TFs,這些基因可通過來自單個細(xì)胞的局部染色質(zhì)可及性信號預(yù)測表達(dá)水平拴事,這可能是因為存在大量與表達(dá)相關(guān)的基因沃斤。這些聯(lián)系讓人想起了用于類似現(xiàn)象的其他術(shù)語,包括“super enhancers”和“super-interactive promoters”刃宵。此外衡瓶,GPC的染色質(zhì)可及性與某些循環(huán)祖細(xì)胞(cycling progenitors)中分化程度更高的細(xì)胞狀態(tài)一致。最近牲证,Ma等人報道了一種現(xiàn)象哮针,通過這種現(xiàn)象,在類似定義的調(diào)節(jié)染色質(zhì)區(qū)域的可及性描繪了潛在的未來細(xì)胞狀態(tài)。
我們推測十厢,許多增強子對譜系定義因子的協(xié)同作用使這些因子的表達(dá)更能抵抗干擾等太。譜系決定反式作用因子(TF)的高度協(xié)同調(diào)節(jié)可能是命運決定的一般原則,一旦關(guān)鍵分化基因被表達(dá)蛮放,就作為一種積極的反饋機(jī)制缩抡。有效地,一旦激活包颁,這些增強子可能起到棘輪(ratchet)的作用瞻想,確保穩(wěn)定的基因表達(dá),并防止在面臨外部或內(nèi)部干擾時沿著分化景觀回溯(backtracking)娩嚼。
通過研究GluN遷移和成熟的軌跡蘑险,我們發(fā)現(xiàn)了一個分子程序,該程序在妊娠8周內(nèi)是一致的岳悟,并由一系列基序定義佃迄。偽時間(pseudotime)內(nèi)神經(jīng)元調(diào)節(jié)活性的差異比發(fā)育階段之間的差異更為顯著。我們進(jìn)一步發(fā)現(xiàn)竿音,在偽時間(pseudotime)早期和屎,TFs之間的共同可及性和調(diào)節(jié)相互作用的不同模式,而晚期TFs似乎更獨立地發(fā)揮作用春瞬。
我們還觀察到柴信,在神經(jīng)膠質(zhì)細(xì)胞(glial cells)中,TF調(diào)節(jié)的基因表達(dá)程序大量共享宽气,含有星形膠質(zhì)細(xì)胞和少突膠質(zhì)細(xì)胞典型標(biāo)記的基因模塊之間存在大量重疊随常。我們驗證了其中幾個基因在人類大腦皮層中的共表達(dá)。我們還提供了證據(jù)證明存在兩種星形膠質(zhì)細(xì)胞樣膠質(zhì)前體細(xì)胞譜系萄涯。盡管神經(jīng)膠質(zhì)模塊廣泛地相互連接绪氛,但我們發(fā)現(xiàn)循環(huán)細(xì)胞(cycling cells)中GPC的染色質(zhì)活性可預(yù)測特定的分化狀態(tài),這表明進(jìn)入細(xì)胞周期的祖細(xì)胞向特定譜系啟動涝影。
最后枣察,我們將DNA序列與染色質(zhì)可及性聯(lián)系起來的可解釋的細(xì)胞類型特異性深度學(xué)習(xí)模型可用于評估de novo, noncoding mutations的潛在調(diào)節(jié)影響。單個堿基對調(diào)控潛力的建模對于識別這些假定的因果突變至關(guān)重要燃逻,因為與開放染色質(zhì)區(qū)域的簡單重疊不能提供所需的特異性序目。我們觀察到ASD患者的突變豐富,而對照組接近有害蛋白質(zhì)編碼突變的水平伯襟。我們預(yù)計猿涨,隨著越來越多的大規(guī)模ATAC-seq和RNA-seq數(shù)據(jù)集在發(fā)育過程中可用,類似的方法將允許準(zhǔn)確解釋與其他發(fā)育障礙相關(guān)的非編碼從頭突變的基因調(diào)控影響
Limitations of the study
盡管這些數(shù)據(jù)跨越妊娠中期8周姆怪,但在早期和晚期進(jìn)行分析將有助于進(jìn)一步研究膠質(zhì)細(xì)胞生成和神經(jīng)元成熟叛赚,例如澡绩,將星形膠質(zhì)細(xì)胞前體與成人亞型聯(lián)系起來。特別令人感興趣的是采用快速發(fā)展的譜系追蹤方法來解決此處確定的發(fā)展軌跡俺附。雖然多組數(shù)據(jù)驗證了許多關(guān)鍵推斷肥卡,但使用數(shù)據(jù)整合推斷將單組ATAC-seq與RNA-seq連接起來并推斷細(xì)胞之間的譜系關(guān)系是本研究的一個限制。
此外昙读,我們的細(xì)胞特異性模型考慮variants對僅存在于特定細(xì)胞類型的峰的影響召调。因此,這些細(xì)胞類型特異性模型可能具有更大的意義蛮浑,這是通過在pseudobulk peak調(diào)用中對更大的重疊突變集進(jìn)行評分來實現(xiàn)的唠叛,以便更深入地了解受變體影響的特定細(xì)胞類型。最后沮稚,確認(rèn)本研究中優(yōu)先考慮的非編碼從頭突變的有害性質(zhì)需要在同源細(xì)胞類型中進(jìn)行分子驗證艺沼。
小結(jié)
1.利用多組學(xué)的方法構(gòu)建了單細(xì)胞轉(zhuǎn)錄組和表觀組大腦發(fā)育圖譜,描述了DNA結(jié)合因子和順式調(diào)節(jié)元件之間的分子相互作用如何調(diào)節(jié)基因表達(dá)程序蕴掏;
2.我們鑒定了一組基因(GPC)(可以通過染色質(zhì)可及性活性區(qū)預(yù)測其基因表達(dá))障般,這些基因富集譜系決定TFs;
3.偽時間(pseudotime)內(nèi)神經(jīng)元調(diào)節(jié)活性的差異比發(fā)育階段之間的差異更為顯著盛杰。在偽時間(pseudotime)早期挽荡,TFs之間的共同可及性和調(diào)節(jié)相互作用的不同模式,而晚期TFs似乎更獨立地發(fā)揮作用即供。
4.在神經(jīng)膠質(zhì)細(xì)胞(glial cells)中定拟,TF調(diào)節(jié)的基因表達(dá)程序大量共享,含有星形膠質(zhì)細(xì)胞和少突膠質(zhì)細(xì)胞典型標(biāo)記的基因模塊之間存在大量重疊逗嫡。
5.再開發(fā)了一種細(xì)胞類型特異性富集模型去預(yù)測變異可能在的細(xì)胞類型青自。
總結(jié)近兩年cell文章發(fā)現(xiàn),圖譜類文章一般構(gòu)建圖譜進(jìn)行描述+常規(guī)分析+構(gòu)建機(jī)器學(xué)習(xí)模型/開發(fā)軟件驱证。
接下來將分版塊介紹這篇文獻(xiàn)所用到的不同的分析方法延窜。