scATAC:人類基因組的染色質(zhì)可及性圖譜
scATAC:人類基因組的染色質(zhì)可及性圖譜-1
scATAC:人類基因組的染色質(zhì)可及性圖譜-2
results3:
An atlas of cCREs in adult human cell types
成年人類的細(xì)胞類型cCRES圖譜
為了識(shí)別 111 種細(xì)胞類型中的每一種中的可接近染色質(zhì)區(qū)域,我們匯總了來(lái)自每個(gè)細(xì)胞簇的所有細(xì)胞核的染色質(zhì)可接近性概況煤裙,并應(yīng)用了針對(duì)單細(xì)胞數(shù)據(jù)優(yōu)化的峰值調(diào)用程序戏售。然后雁竞,我們合并了這些可訪問(wèn)的染色質(zhì)區(qū)域,以獲得 890,130 個(gè)non-overlapping cCRE 的列表(圖 2A)氛赐。
這些 cCRE 涵蓋了 ENCODE 聯(lián)盟發(fā)布的 cCRE 注冊(cè)表中 58.9% 的元件续担,還包括 420,152 個(gè)以前未注釋的元素。為了對(duì)這些 cCRE 進(jìn)行基準(zhǔn)測(cè)試(benchmark)腋粥,我們接下來(lái)比較了在當(dāng)前研究中由批量 DNase-seq 分析的生物樣本和由 sci-ATAC-seq 識(shí)別的細(xì)胞類型之間的染色質(zhì)可及性概況〖懿埽總的來(lái)說(shuō),sci-ATAC-seq 細(xì)胞類型比bulk tissue或永生化細(xì)胞系生物樣品更接近原代細(xì)胞類型生物樣品闹瞧,并且由 sci-ATAC-seq 定義的具有較高組織豐度的流行細(xì)胞類型與bulk tissue更相似,與DNase-seq 生物樣本相比绑雄,具有更多稀有細(xì)胞類型。在當(dāng)前研究中描述的 111 種細(xì)胞類型中奥邮,44 種(40%)與 ENCODE 聯(lián)盟描述的任何大量生物樣本沒(méi)有顯示出統(tǒng)計(jì)學(xué)上顯著的相關(guān)性万牺。這些細(xì)胞類型中有許多是罕見(jiàn)的:它們的最大組織豐度中位數(shù)僅為 3.2%,其中 36 個(gè)(81.8%)占任何組織中所有細(xì)胞的不到 10%洽腺〗潘冢總之,這些研究結(jié)果表明蘸朋,我們的數(shù)據(jù)集將以前代表性不足的 cCRE 從體內(nèi)人類細(xì)胞類型貢獻(xiàn)到現(xiàn)有目錄中核无,特別是來(lái)自bulk tissue中豐度低的細(xì)胞類型。
為了評(píng)估這些 cCRE 的潛在功能藕坯,我們接下來(lái)將它們與轉(zhuǎn)基因報(bào)告基因驗(yàn)證的哺乳動(dòng)物增強(qiáng)子目錄進(jìn)行比較团南,發(fā)現(xiàn)經(jīng)過(guò)驗(yàn)證的組織特異性增強(qiáng)子在占很大比例的細(xì)胞類型中,并且在對(duì)應(yīng)組織中鑒定出的細(xì)胞核表現(xiàn)出更高的染色質(zhì)可及性 (圖 2B)炼彪。
例如吐根,與其他細(xì)胞類型相比,心臟中經(jīng)過(guò)驗(yàn)證的增強(qiáng)子在心房心肌細(xì)胞(Z 評(píng)分:1.41)和心室心肌細(xì)胞(Z 評(píng)分:1.43)中顯示出更高的平均染色質(zhì)可及性(圖 2B)辐马,這表明細(xì)胞類型特異性之間存在良好的相關(guān)性染色質(zhì)可及性和組織特異性增強(qiáng)子活性拷橘。我們進(jìn)一步發(fā)現(xiàn),來(lái)自 49 種成人組織類型(GTEx Consortium喜爷,2020)的表達(dá)數(shù)量性狀基因座 (eQTL) 在流行的細(xì)胞類型中最常見(jiàn)冗疮,例如內(nèi)皮細(xì)胞和平滑肌細(xì)胞。此外贞奋,來(lái)自同質(zhì)組織(如肝臟和甲狀腺)的 eQTL 在相應(yīng)的細(xì)胞類型中顯示出最強(qiáng)的可及性赌厅,這些細(xì)胞類型包含組織中鑒定的大部分細(xì)胞核。這些結(jié)果表明轿塔, bulk tissue eQTL 最能代表與豐富細(xì)胞類型和同質(zhì)組織中的基因表達(dá)相關(guān)的序列變異特愿,并且對(duì)于同質(zhì)組織中的稀有細(xì)胞類型或異質(zhì)組織中的獨(dú)特細(xì)胞類型可能不太具有代表性仲墨。
接下來(lái),我們根據(jù)到最近的 TSS 的距離對(duì)每個(gè) cCRE 進(jìn)行分類揍障,如圖 2A 所示目养。當(dāng)前目錄中的大多數(shù) (80.94%) cCRE 與帶注釋的 TSS 相距超過(guò) 2,000 bp。直接位于 TSS 上方或啟動(dòng)子區(qū)域附近的 cCRE 顯示出更高水平的序列保守性和更高的染色質(zhì)可及性(圖 2C 和 2D)毒嫡。
相比之下癌蚁,基因遠(yuǎn)端 cCRE 的可訪問(wèn)性較低,并且相對(duì)于其可訪問(wèn)性顯示出更大的差異(圖 2D)兜畸,表明存在高度可訪問(wèn)的啟動(dòng)子近端 cCRE 的共享程序以及跨細(xì)胞類型和物種的基因遠(yuǎn)端 cCRE 的可變程序努释。為了進(jìn)一步剖析細(xì)胞類型特異性染色質(zhì)特征和調(diào)控程序,我們應(yīng)用基于熵的策略揭示了 435,142 個(gè) cCRE咬摇,這些 cCRE 在一種或幾種細(xì)胞類型中表現(xiàn)出受限的可及性(圖 2E)伐蒂。
接下來(lái),我們對(duì)細(xì)胞類型受限的 cCRE 應(yīng)用了 GREAT GO富集分析和基序富集分析肛鹏,以揭示每種細(xì)胞類型的推定生物學(xué)過(guò)程和 TF逸邦,這在很大程度上與預(yù)期的細(xì)胞類型特異性功能相關(guān)( [FDR] <0.01) .例如,僅限于肝細(xì)胞的 cCRE 產(chǎn)生了生物過(guò)程GO Term在扰,例如類固醇代謝過(guò)程(圖 2F)缕减,
并且富含肝細(xì)胞核因子 TF 家族成員 HNF1A/B、HNF4A/G 和 ONECUT1/2 的結(jié)合位點(diǎn)(圖 2G) 芒珠。