文獻名:Chromatin and gene-regulatory dynamics of the developing human cerebral cortex at single-cell resolution
manifold:
流形是一種空間,一個流形好比是一個 d 維的空間铭污,在一個 m 維的空間中 (m > d) 被扭曲之后的結(jié)果(一般維度壓縮的方法中都會提到這個詞刹淌,譜聚類中就有涉及這個思想),可以類似于地球察滑,地球的表面是一個球面。
流形的距離度量方法不能簡單地使用歐式距離求任意兩點地距離修肠。假設(shè)現(xiàn)在需要求從北極到達南極距離贺辰,不可能把地球打穿直線到達,根據(jù)實際情況可以知道,北極到達南極的距離應(yīng)該是半個圓周的長度
原文鏈接:https://blog.csdn.net/qq_30545831/article/details/81776819
Part4:
Chromatin and gene expression profiles identify two astrocyte precursor populations
染色質(zhì)和基因表達譜確定了兩個星形膠質(zhì)細(xì)胞前體群體
人類皮質(zhì)星形膠質(zhì)細(xì)胞更大饲化,形態(tài)更復(fù)雜莽鸭,并且可能比其他哺乳動物的更多樣化。然而吃靠,人類星形膠質(zhì)細(xì)胞潛在多樣化的基本步驟尚不清楚蒋川。作者觀察到三個相互連接的模糊基因模塊,主要來源于PCW24組織撩笆,表達AQP4捺球、TNC、ALDH2和APOE夕冲,以及星形膠質(zhì)細(xì)胞中特異表達的其他基因(m2氮兵、m13、m14)(圖5A)歹鱼。
為了測試這些轉(zhuǎn)錄相關(guān)但不同的亞群是否與不同的調(diào)節(jié)因子相關(guān)泣栈,作者計算了與m13和m14基因相關(guān)的增強子之間的差異基序富集。作者發(fā)現(xiàn)基本螺旋-環(huán)-螺旋(bHLH)因子基序ASCL1和NHLH1在模塊m13中富集弥姻,而SOX21在m14中富集(圖5B)南片。
在作者研究結(jié)果的神經(jīng)膠質(zhì)細(xì)胞中,ASCL1和NHLH1基序的可及性與bHLH因子OLIG1的基因表達相關(guān)性最好庭敦,并且作者先前已將SOX21指定為皮質(zhì)類器官星形膠質(zhì)細(xì)胞成熟的潛在調(diào)節(jié)因子疼进。因此,通過OLIG1與SOX21基序的染色質(zhì)可及性可以區(qū)分兩種不同的星形膠質(zhì)細(xì)胞樣表達模式秧廉。
為了更詳細(xì)地檢查表達這些模塊的細(xì)胞之間的差異伞广,作者計算了星形細(xì)胞簇A1-HES和A2-OLIG之間的差異基因表達,分別對應(yīng)于模塊m2/14和m13的表達(圖5C和5D疼电;表S5)嚼锄。
簇A1-HES表現(xiàn)出HES4和CAV2的顯著高表達,而A2-OLIG的特征是SPARCL1蔽豺、ID3和IGFBP7表達增加(圖5D)区丑。
為了確定這些不同的星形膠質(zhì)細(xì)胞前體亞型是否是由于不同皮質(zhì)區(qū)域的取樣所致,作者使用了最近發(fā)布的scRNA-seq數(shù)據(jù)集(圖5E)修陡。
作者發(fā)現(xiàn)沧侥,在這個獨立的數(shù)據(jù)集中,屬于作者的星形細(xì)胞類別的基因集在不同的細(xì)胞群中表達濒析,這一觀察結(jié)果不能用皮質(zhì)區(qū)域的差異來解釋(圖5F)正什。
這些發(fā)育狀態(tài)可能對應(yīng)于成年亞型啥纸,例如在整個皮質(zhì)灰質(zhì)中發(fā)現(xiàn)的原生質(zhì)星形膠質(zhì)細(xì)胞号杏,在白質(zhì)中發(fā)現(xiàn)的纖維狀星形膠質(zhì)細(xì)胞,或populate layer 1的靈長類特異性 interlaminar 星形膠質(zhì)細(xì)胞。
Part5:
Chromatin state links GPCs to lineage determination in cycling cells
染色質(zhì)狀態(tài)將GPC與循環(huán)細(xì)胞中的譜系測定聯(lián)系起來
接下來盾致,作者研究了祖細(xì)胞的染色質(zhì)狀態(tài)如何可能影響表達程序的獲得主经,這些表達程序具有更分化的細(xì)胞狀態(tài)的特征。因此庭惜,作者關(guān)注表達與細(xì)胞周期特征密切相關(guān)的基因模塊的細(xì)胞之間的異質(zhì)性(圖6A罩驻;Pearson r分別為0.89和0.91)。
為了將染色質(zhì)可及性與以膠質(zhì)細(xì)胞為中心的表達圖譜聯(lián)系起來护赊,作者使用可及性衍生的基因活性得分將13378個膠質(zhì)細(xì)胞scATAC-seq細(xì)胞的假體積聚集體投射到作者的基因模塊衍生的流形中惠遏。與作者的CCA簇匹配分析(圖2B)一致,pseudobulks主要由投射到該圖少突膠質(zhì)細(xì)胞終點的ATAC簇c15(OPC/LIGO)細(xì)胞骏啰、投射到ASCL1+/OLIG2+星形膠質(zhì)細(xì)胞室的簇c10(mGPC)數(shù)據(jù)和簇c9(late RG)組成投射到室管膜和HES4+星形膠質(zhì)細(xì)胞endpoints的數(shù)據(jù)(圖6B)节吮。
然而,雖然作者在染色質(zhì)landscape中沒有觀察到明顯的循環(huán)簇判耕,但這些ATAC-seq假塊樣本的一個子集投射到RNA-seq嵌入的cycling cluster透绩、 early-pseudotime compartment中。這些樣本被劃分為三個不同的分支壁熄,它們由scATAC seq cluster 分配定義(圖6C)帚豪。
作者推測RNA-seq中強大的cell-cycle signatures可能減少了這些差異,而這些差異在ATAC-seq數(shù)據(jù)中更為明顯草丧,分析這些獨立的分支可能使作者能夠確定cycling progenitors是否傾向于不同的有絲分裂后命運狸臣。
為了探索影響這些命運決定的因素,作者根據(jù)每個分支的gene activity scores確定了每個分支的特定基因昌执。作者觀察到這些基因與一組GPC(包括HES1固棚、RFX4、OLIG1仙蚜、OLIG2此洲、NEUROD6和EOMES)有很強的重疊∥郏總的來說呜师,所有三個cycling cells分支中的差異染色質(zhì)活性都因GPC而富集(圖6D)。
每個分支在前五個最獨特的基因(BHLHE40贾节、OLIG1汁汗、OLIG2、NEUROD6栗涂、NEUROD4)中至少富集了一個bHLH GPC TF(圖6E)知牌。
這些factors的注釋motif的相似性與假設(shè)一致,即它們可以競爭相似的結(jié)合位點來驅(qū)動多個不同的細(xì)胞命運斤程〗谴纾總之菩混,這些結(jié)果表明,GPC的不同染色質(zhì)活性和基因表達是區(qū)分不同類型 cycling glial progenitor cells.的顯著特征扁藕。
接下來沮峡,作者想知道這些GPC是否既與密集的調(diào)控元件集合高度相關(guān),又高度富集譜系定義的轉(zhuǎn)錄因子亿柑。為了評估這些聯(lián)系是否可能是最終分化終點的指標(biāo)邢疙,從而潛在地驅(qū)動分化,作者僅使用GPC相關(guān)染色質(zhì)信號重新預(yù)測A望薄、B和C循環(huán)群體分支的ATAC-seq pseudobulk 樣本疟游。作者觀察到樣本在偽時間內(nèi)向前移動到具有不同、更成熟表達狀態(tài)的區(qū)域(圖6F)痕支,
而使用隨機基因亞群或基因模塊的重投影則非特異性地向流形的中心移動乡摹。這一觀察結(jié)果表明,這些循環(huán)細(xì)胞中與GPC基因相關(guān)的染色質(zhì)模式已經(jīng)顯示出高級轉(zhuǎn)錄細(xì)胞狀態(tài)的特征采转。類似地聪廉,當(dāng)作者將來自聯(lián)合多組數(shù)據(jù)集的scRNA-seq數(shù)據(jù)投射到基于模塊的manifold中時,投射到循環(huán)域的一部分細(xì)胞顯示出來自每個分支的更多分化細(xì)胞的不同可訪問性特征(圖6G)故慈“逍埽基于這些結(jié)果,作者提出察绷,在皮質(zhì)發(fā)生過程中干签,進入細(xì)胞周期的祖細(xì)胞可能在表觀遺傳學(xué)上為未來的細(xì)胞命運做好準(zhǔn)備,并且該信息在GPC中進行了編碼拆撼,GPC是一組具有大量連接增強子的基因容劳,豐富了與譜系定義的TFs的結(jié)合。
Part6:
Deep-learning models prioritize disruptive noncoding mutations in ASD
深度學(xué)習(xí)模型優(yōu)先考慮ASD中的disruptive非編碼突變
接下來闸度,作者使用作者的圖譜解釋ASD中的非編碼從頭突變竭贩,使用1902個家族中超過200000個此類突變的Simons Simplex集合目錄(表S6)。與未受影響兄弟姐妹相比莺禁,具有簇特異性scATAC-seq峰的突變的原始重疊(Naive overlap)不會使ASD個體的突變富集(GluN6簇的優(yōu)勢比[OR]=1.02留量,F(xiàn)isher精確檢驗p=1.0;圖S8F)哟冬,表明僅峰值水平注釋不足以解決一組稀疏的因果突變楼熄。
深度學(xué)習(xí)模型已被證明有助于根據(jù)預(yù)測的監(jiān)管影響對疾病相關(guān)的非編碼基因變體進行優(yōu)先排序。因此浩峡,作者基于最新的BPNet架構(gòu)對卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練可岂,以學(xué)習(xí)能夠預(yù)測每個scATAC-seq衍生細(xì)胞類型的堿基分辨率、pseudo-bulk染色質(zhì)可及性的模型翰灾,這些細(xì)胞類型來自基因組序列(圖7A)
使用峰區(qū)和基因組背景缕粹,匹配GC含量和基序密度稚茅,以糾正潛在的序列組成偏差。模型顯示致开,在交叉驗證模型的5倍范圍內(nèi)峰锁,預(yù)測的總Tn5插入計數(shù)覆蓋率與觀察到的Tn5插入計數(shù)覆蓋率之間存在高度穩(wěn)定的相關(guān)性(例如萎馅,GluN6双戳,平均Spearman rho=0.58)。為了預(yù)測候選突變對染色質(zhì)可及性的細(xì)胞上下文特異性影響糜芳,作者使用作者的cluster特異性BPNet模型根據(jù)預(yù)測計數(shù)中的等位基因fold-change變化計算local disruption score飒货。對于每個簇,作者計算了病例組和對照組中high- effect-size突變的富集程度峭竣。作者觀察到GluN2/3/4/6/9的ASD相關(guān)突變顯著富集(>1.2倍)塘辅,這與之前的研究一致。此外皆撩,作者發(fā)現(xiàn)了與IN2/3/4扣墩、nIPC、late RG和early RG簇的強烈關(guān)聯(lián)扛吞。early RG簇的富集程度最高(OR=1.909呻惕,超過20,F(xiàn)isher精確p<0.05滥比;圖7B亚脆;表S6)。
作者還觀察到盲泛,這種對因果破壞性突變進行優(yōu)先排序的方法對閾值參數(shù)選擇具有魯棒性濒持。相比之下,使用人類胎心增強劑訓(xùn)練的BPNet模型沒有產(chǎn)生富集(OR=1.01寺滚,p=1.0)柑营。同樣,使用一組胎心enhancers的naive overlap enrichment也不會對病例突變產(chǎn)生富集(OR=0.97村视,p=1.0由境;圖7C)”鸵椋總之虏杰,這些結(jié)果表明,在與疾病相關(guān)的細(xì)胞狀態(tài)中勒虾,對染色質(zhì)可及性景觀進行訓(xùn)練的堿基對分辨率預(yù)測模型的突變效應(yīng)分?jǐn)?shù)對于確定假定的因果非編碼突變的優(yōu)先級至關(guān)重要纺阔。
BPNet模型優(yōu)先考慮的病例和對照突變具有相似的保守性得分和與最近轉(zhuǎn)錄起始點(TSS)的相似距離,突出了通過其他方法識別這些因果突變的挑戰(zhàn)修然。通過對預(yù)測的高效應(yīng)大小突變及其最近的基因進行注釋笛钝,作者觀察到SFARI數(shù)據(jù)庫中最近基因的病例突變(n=24)比對照突變(n=17质况;圖7D)富集1.4倍。
接下來玻靡,作者確定了overlapped的TF基序结榄,并預(yù)測其將被來自所有正富集簇的BPNet模型的所有高效大小突變所破壞(圖7E,表S6)囤捻。作者發(fā)現(xiàn)臼朗,在病例組和對照組中,劃分demarcates topological loop boundaries的CTCF是最常被破壞的基序之一蝎土。NRF1基序是另一個經(jīng)常被破壞的基序视哑。NRF調(diào)節(jié)先前與疾病相關(guān)的GABA受體亞單位GABRB1。與對照組相關(guān)的病例中其他經(jīng)常被破壞的基序家族包括E-box/bHLH家族基序(ASCL1誊涯,NEUROD6)和同源框家族(PAX5)基序挡毅,具有更多譜系特異性效應(yīng)。之前也發(fā)現(xiàn)同源框蛋白被ASD中的變體破壞暴构。
作者模型中的一個高度破壞性突變位于NFIA的一個內(nèi)含子中(圖7F和S8M)跪呈。該基因的功能缺失突變先前與ASD有關(guān)。該突變位于NFIA靶基因的連鎖內(nèi)含子增強子中取逾。作者觀察到耗绿,這種增強子在不同類型的GluN cluster中特別容易獲得。GluN6的BPNet模型預(yù)測了破壞NFIA基序的突變菌赖,表明該突變可能通過自動調(diào)節(jié)反饋失調(diào)NFIA基因的表達缭乘。
在nIPC集群中,BPNet模型預(yù)測了與神經(jīng)肽Y基因(NPY)相連的基因間增強子的破壞性從頭突變琉用,其TSS距離突變90 kb(圖7G)堕绩。NPY在妊娠中期人類皮質(zhì)的subplate和早期RG中表達,NPY受體的基因組缺失與ASD相關(guān)邑时。該模型進一步預(yù)測了這種從頭突變破壞染色質(zhì)環(huán)錨定處的CTCF結(jié)合位點奴紧,表明該位點的染色質(zhì)結(jié)構(gòu)可能受到潛在的機械影響。
(終于把這篇文獻譯完了)