scATAC:人類基因組的染色質(zhì)可及性圖譜
scATAC:人類基因組的染色質(zhì)可及性圖譜-1
scATAC:人類基因組的染色質(zhì)可及性圖譜-2
scATAC:人類基因組的染色質(zhì)可及性圖譜-3
scATAC:人類基因組的染色質(zhì)可及性圖譜-4
result5:Delineation of cell-type specificity of human cCREs
人類細(xì)胞類型特異性cCREs的描述
為了表征 cCRE 在胎兒和成人細(xì)胞類型中的細(xì)胞類型特異性灌侣,我們根據(jù) 222 種細(xì)胞類型的標(biāo)準(zhǔn)化可及性將 1,154,611 個 cCRE 組織成 150 個簇诅岩,稱為順式調(diào)節(jié)模塊 (CRM)。 盡管幾個 CRM 顯示所有細(xì)胞類型的共享可訪問性模式东臀,但大多數(shù) CRM 僅限于單個胎兒或成人細(xì)胞類型或反映共享細(xì)胞譜系的細(xì)胞類型組(圖 5A)。
為了注釋 CRM 的推定功能入宦,我們應(yīng)用了 GREAT GO富集分析 串绩。 從廣義上講,在特定胎兒和成人細(xì)胞類型中顯示出優(yōu)先可及性的 CRM 富集了與細(xì)胞類型和生命階段特定細(xì)胞過程相關(guān)的生物過程GO term(FDR <0.01)(圖 5B 和 5C)割坠。
為了識別這些 CRM 的序列特征,我們接下來測量了 150 個 CRM 中 1,565 個人類 TF 基序的富集妒牙,以揭示胎兒和成人人類細(xì)胞類型的推定主要調(diào)節(jié)因子彼哼。該分析揭示了胎兒和成人細(xì)胞和譜系特異性 TF motif的綜合目錄。例如湘今,在成人 CD8+ T 細(xì)胞和自然殺傷 T 細(xì)胞中具有強(qiáng)可及性的模塊通過 TBR敢朱、EOMES 和 TBX TF 家族基序的富集來區(qū)分(模塊 8,p < 1e 84)(圖 5B-5D)摩瞎,模塊通過富集 EBF 家族 TF 基序(模塊 13拴签,p = 1e 27;模塊 17愉豺,p = 1e 197)來區(qū)分 B 細(xì)胞中具有強(qiáng)可及性的模塊篓吁,并且在成體肥大細(xì)胞中具有強(qiáng)可及性的模塊的區(qū)別在于GATA 家族成員基序富集(模塊 25,p = 1e 84)(圖 5B-5D)蚪拦。
此外杖剪,在所有已識別的細(xì)胞類型中具有最強(qiáng)可訪問性的模塊的特點是富集 SP1 motif(模塊 1,p = 1e 9180)驰贷,與 SP1 作為普遍表達(dá)的管家基因的調(diào)節(jié)因子的原始描述一致盛嘿。除了這些特征明確的關(guān)聯(lián)之外,我們還報告了以前未定義的 TF 與人類細(xì)胞類型的關(guān)聯(lián)括袒,這些關(guān)聯(lián)在體內(nèi)組織環(huán)境中難以研究:例如次兆,ESRR 的motif(模塊 92,p = 1e 357 ; 模塊 93, p = 0.1) 和 FOX (模塊 92, p = 1e 36; 模塊 93, p = 1e 255) TF 家族分別更加富集胎兒 (模塊 92) 和成人 (模塊 93) 胃上皮細(xì)胞可及性模塊(圖 5A)锹锰,F(xiàn)OS 和 JUN 家族的在胎兒和成人腎上腺皮質(zhì)細(xì)胞可ji及的模塊中富集(模塊 135-138芥炭,p < 1e 10;圖 5A)恃慧。
result6:Association of human cell types with complex traits and diseases
人類細(xì)胞類型與復(fù)雜性狀的關(guān)聯(lián)
接下來园蝠,我們試圖使用我們的 120 萬個細(xì)胞類型分辨率下的的 cCRE 來解釋與復(fù)雜性狀和多基因疾病表型相關(guān)的遺傳變異。我們下載了 NHGRI-EBI GWAS 目錄并保留了 1,123 個具有 10 個或更多顯著 SNP 和 20,000 多個案例(占 8,219 個 GWAS 出版物的 14%)的功能強(qiáng)大的 GWAS痢士。然后彪薛,我們使用超幾何檢驗來測量從 222 種胎兒和成人細(xì)胞類型中識別的 cCRE 中性狀相關(guān)變體的富集。發(fā)現(xiàn) 450 種性狀/疾病的 GWAS 變異富含來自至少一種細(xì)胞類型的 cCRE(FDR <0.1%)。作為比較善延,EpiMap 是一個綜合增強(qiáng)子目錄少态,包含來自大量人體組織樣本、原代細(xì)胞和離體細(xì)胞系的 833 個表觀基因組圖譜易遣,它捕獲了 457 項 GWAS 研究(FDR <0.1%)彼妻。對于本研究和 EpiMap 共有的 290 個性狀,我們的數(shù)據(jù)在 74.8% 的病例(290 個中的 217 個)中捕獲了最強(qiáng)的 GWAS 富集训挡,并通過將復(fù)雜性狀與特定細(xì)胞類型聯(lián)系起來提供了改進(jìn)的分辨率澳骤。此外歧强,對于 160 個額外的性狀澜薄,我們能夠識別在之前的分析中未檢測到的富集,突出了細(xì)胞類型解析的 cCREs 圖的附加值摊册。
上述 GWAS 富集分析僅考慮索引變體(即全基因組重要基因座中的 SNP)肤京。然而,由于連鎖不平衡茅特,索引變體可能不代表特定的因果變體忘分,并且大部分遺傳性在于 SNP 的關(guān)聯(lián)未達(dá)到全基因組顯著性。因此白修,我們利用可公開獲得的匯總統(tǒng)計數(shù)據(jù)策劃了 240 項 GWAS 研究妒峦,并使用分層連鎖不平衡評分回歸 (LDSC) 檢查了其相關(guān) SNP 在胎兒和成人細(xì)胞類型中注釋的 cCRE 中的富集,這是一種使用基因組從 GWAS 匯總統(tǒng)計中識別功能富集的方法- 來自所有 SNP 的廣泛信息和顯式建模連鎖不平衡兵睛。該分析揭示了胎兒和成人細(xì)胞類型與人類特征和疾病表型之間共有 3,220 個顯著(FDR <0.1)關(guān)聯(lián)(圖 6肯骇;表 S4)。
這些富集揭示了許多預(yù)期的細(xì)胞類型-疾病表型關(guān)系——例如祖很,濕疹風(fēng)險變異體在成人 T 淋巴細(xì)胞 cCREs 中強(qiáng)烈富集笛丙,心房顫動風(fēng)險變異體在成人和胎兒心房和心室心肌細(xì)胞 cCREs 中強(qiáng)烈富集(FDR < 0.001),并且促甲狀腺激素變體富含濾泡細(xì)胞 cCRE(圖 6假颇;表 S4)胚鸯。除了預(yù)期的關(guān)系外,我們的分析還揭示了 GWAS 富集了目前尚未被批量 DNase-seq 或 ATAC-seq 數(shù)據(jù)注釋的人類細(xì)胞類型笨鸡。這些包括除了胎兒和成人成纖維細(xì)胞姜钳、周細(xì)胞和內(nèi)皮細(xì)胞 cCREs (FDR <0.01) 外,成人血管平滑肌 cCREs (FDR <0.001) 中冠狀動脈疾病變體的強(qiáng)富集形耗,幾種成人間質(zhì)平滑肌細(xì)胞類型中的 COPD 變體(FDR <0.01)哥桥、成人脂肪細(xì)胞 cCREs 中與甘油三酯和 HDL 膽固醇水平相關(guān)的變體 (FDR <0.01),以及結(jié)腸上皮細(xì)胞 cCREs 中潰瘍性結(jié)腸炎變體的名義富集 (p < 0.02)趟脂。有趣的是泰讽,我們檢測到成人和胎兒成纖維細(xì)胞亞型中疾病和性狀相關(guān)非編碼變異的富集存在顯著差異。這些包括顯著富集與胎兒成纖維細(xì)胞中的出生體重相關(guān)的變異(FDR <0.01),但在成人成纖維細(xì)胞中沒有(表 S4)已卸。此外佛玄,我們檢測到成人成纖維細(xì)胞亞型中疾病和性狀變異的富集差異,除了在一組核心成纖維細(xì)胞 cCRE 上具有可比的染色質(zhì)可及性外累澡,每個亞型都顯示出獨特的調(diào)控元件(圖 S7)梦抢。盡管所有成人成纖維細(xì)胞群都富集了與站立高度相關(guān)的變體至同等程度(FDR <0.001),但成人上皮成纖維細(xì)胞顯示出與禿頂相關(guān)的變體的顯著富集(FDR <0.001)愧哟,并且只有成人心臟成纖維細(xì)胞顯示出任何變體富集與心肌分形維數(shù)相關(guān)(FDR <0.1)(表 S4)奥吩。