單細胞 CUT&Tag 分析??
隨著10X优质、BD等平臺技術(shù)的推進骑祟,單細胞層面解析表達和開放染色質(zhì)水平的研究方法已經(jīng)得到很好的建立涣澡,并且在動植物種中都得到了很好的嘗試划滋。
對于研究特定組蛋白修飾或轉(zhuǎn)錄因子結(jié)合的染色質(zhì)區(qū)域的單細胞分析在技術(shù)上具有挑戰(zhàn)性扑媚。今天小編和大家分享一篇今年四月份發(fā)表于Nature Biotechnology 的article 《Single-cell CUT&Tag profiles histone modifications and transcription factors in complex tissues》腰湾。
這篇文章使用調(diào)整了基于10x Genomics單細胞 ATAC-seq平臺,開發(fā)并應(yīng)用了單細胞Cut&Tag (scCUT&Tag)手段疆股,以研究小鼠大腦中單細胞水平的組蛋白修飾譜费坊。在之前的研究中作者發(fā)現(xiàn)少突膠質(zhì)細胞譜系 (OLG) 具有異質(zhì)性,并且能夠在發(fā)育和疾病期間轉(zhuǎn)變?yōu)樘娲毎麪顟B(tài)旬痹「骄基于此,作者構(gòu)建了組蛋白修飾两残、染色質(zhì)結(jié)構(gòu)因子和cohesin復(fù)合物RAD21的亞基以及OLG特異性轉(zhuǎn)錄因子 (TF) OLIG2等非組蛋白的單細胞層面的結(jié)合譜永毅。
技術(shù)路線?
為了研究OLGs,作者使用了一個表達Sox10:Cre/Rosa26:(CAG-LSL-EGFP)小鼠(RCE)的小鼠模型人弓,該模型主要標(biāo)記小鼠中樞神經(jīng)系統(tǒng)(CNS)中的OLGs沼死。作者從P15和P25的小鼠大腦中分離細胞,同時崔赌,作者為了更加明確OLGs的分化意蛀,在P25時期做了兩個重復(fù),分別在少突膠質(zhì)細胞分化的高峰和髓鞘形成的開始時健芭,并分為GFP+和GFP?群體县钥;分離細胞核并與抗染色質(zhì)修飾或TFs的特異性抗體孵育,使用蛋白A-Tn5融合標(biāo)記慈迈,用10x Genomics 的scATAC-seq協(xié)議處理若贮。
實驗技術(shù)路線
分析路線?
將scCUT&Tag信號整合成一個細胞×bin的矩陣,其中,bin分成不同的大小(5kb或50kb)谴麦;使用LSI和UMAP進行降維蠢沿,并使用SNN進行聚類。使用細胞簇來識別標(biāo)記區(qū)域细移,計算每個細胞的基因活性評分搏予,并與其他數(shù)據(jù)集進行整合。
分析路線
在開始正式分析之前為了驗證scCUT&Tag 數(shù)據(jù)是否可用于分辨異質(zhì)細胞群弧轧,作者制備了三種細胞系的混合物:小鼠胚胎干細胞(mESC,C57Bl/6J 來源)碗殷、小鼠胚胎成纖維細胞 (NIH-3T3) (ATCC) 和小鼠少突膠質(zhì)祖細胞模型細胞系(Oli-neu)精绎。然后使用10x Genomics Chromium 平臺對標(biāo)記的細胞核進行條形碼標(biāo)記,使用 v.1 (rep1) 和 v.1.1 (rep2) 10x Genomics scATAC–seq 試劑盒在兩個技術(shù)重復(fù)中針對 H3K27me3 組蛋白修飾進行 scCUT&Tag優(yōu)化锌妻,具體可以參考文章中的方法代乃。最終獲得了4,872和3,873個單細胞的H3K27me3 譜,每個細胞分別具有597和568個獨特的片段仿粹。使用5-kb窗口聚合數(shù)據(jù)并為所有數(shù)據(jù)集生成單元特征矩陣搁吓。為了減少數(shù)據(jù)集的維度,作者使用了LSI及UMAP進行降維吭历,并使用共享最近鄰 (SNN) 和使用 Signac/Seurat v.3 包實現(xiàn)的Leiden算法對單元進行了聚類堕仔。降維和聚類產(chǎn)生了一個被識別為3T3細胞的簇和Oli-neu(Oli-neu_A 和 Oli-neu_B)和 mESC(mES_A 和 mESC_B)的兩個亞簇(下圖a)。作者的數(shù)據(jù)與其他參考數(shù)據(jù)集顯示出了告訴的相似性(下圖b)晌区。同時還對前150個最可變的標(biāo)記峰進行了主成分分析 (PCA)摩骨,并觀察到了各自的批量數(shù)據(jù)和 scCUT&Tag 數(shù)據(jù)的共聚類和相關(guān)性(下圖C)。我們還觀察到相應(yīng)簇之間的兩個 scCUT&Tag技術(shù)復(fù)制之間的峰值信號的高度相關(guān)性(下圖d)和識別的細胞身份比例的一致性(下圖e)朗若。最后恼五,我們在從ChIP-seq 或 CUT&Run 數(shù)據(jù)中繪制了縮小的的H3K27me3信號的元基因圖譜,對比發(fā)現(xiàn)合并大約 200-500 個3T3細胞和 20-50個mESCs 產(chǎn)生了與之相當(dāng)?shù)母哔|(zhì)量圖譜(下圖f-g)哭懈。
附圖1:小鼠細胞系混合物的 scCUT&Tag
結(jié)果?
1灾馒、小鼠大腦中幾種組蛋白修飾的單細胞圖譜及評估
對所有細胞的合并數(shù)據(jù)集的偽bulk分析顯示了不同組蛋白修飾技術(shù)的特異性。特別是H3K4me3主要存在于轉(zhuǎn)錄起始位點的側(cè)翼區(qū)域遣总,H3K27ac同時占據(jù)這些區(qū)域和鄰近的基因間區(qū)域(很可能是增強子)睬罗,H3K36me3分布在整個基因體中。而H3K27me3與其他活性標(biāo)記缺失的基因相關(guān)彤避,或與H3K4me3相一致傅物。
接下來,作者主要進行了單細胞層面的分析琉预,作者基于每個barcode中的reads數(shù)及peak區(qū)域的reads比例作為參數(shù)來篩選真實細胞(PS.10x ATAC中判定peak和細胞很值得一看)董饰。作者獲得了 47,340 個單細胞的各種組蛋白修飾的 scCUT&Tag 譜,每個細胞的中位數(shù)在 98個(H3K36me3)和453個(H3K27ac)unique fragments左右(圖c)。其中有39.4% 至 85.6% 的片段落在窄峰區(qū)域內(nèi)(圖d)卒暂,表明背景水平較低啄栓。片段長度分布與亞核小體片段以及所有修飾的單核小體、雙核小體和三核小體的捕獲一致也祠。
同時作者將數(shù)據(jù)與iCell8 scCUT&Tag與scChIP–seq m比較昙楚,指紋圖譜顯示,與scChIP-seq相比诈嘿,scCUT&Tag具有更高的特異性和更好的信噪比堪旧,其特異性水平與iCell8 scCUT&Tag相似。
2奖亚、單個組蛋白修飾的 scCUT&Tag 可用來識別小鼠大腦中的特定細胞群
為了對細胞進行解卷積和聚類淳梦,作者使用 5 kb(H3K4me3、H3K27ac 和 H3K27me3)以及 50 kb 的分箱大形糇帧(H3K36me3)為所有數(shù)據(jù)集生成了細胞特征矩陣爆袍,并在分析 scCUT&Tag 中鑒定了所有主要的 CNS 細胞群。(圖 1f-i 和圖 2a-f)作郭。通過識別標(biāo)記基因啟動子附近的特定峰(圖 1j陨囊、k 和圖 2a-f),我們手動將亞群注釋為成熟少突膠質(zhì)細胞(MOL夹攒、Mbp+蜘醋、Mog+ 和 Cldn11+)、星形膠質(zhì)細胞(AST芹助、Slc1a2+堂湖、Rfx4+ 和Aqp4+)、嗅鞘細胞(OEC状土、Alx3+无蜂、Alx4+ 和 Frzb+)、血管細胞(VAS蒙谓、Nes+斥季、Tbx18+ 和 Foxf2+)以及少突膠質(zhì)祖細胞 (OPC)、定型 OPCs (COP) 和新形成的內(nèi)突細胞 (oligo NFOLs)(Pdgfra+累驮、Neu4+ 和 Gpr17+)在 GFP+ 部分(圖 1j酣倾、圖 2a-f)。GFP? 細胞主要包括神經(jīng)元(NEU谤专、Rbfox3+ 和 Neurod2+)躁锡、興奮性(Exc、Slc17a7+)和抑制性(Inh、Gad1+ 和 Gad2+)、星形膠質(zhì)細胞(Slc1a2+、Rfx4+ 和 Aqp4+)和小膠質(zhì)細胞(MGL浑测、C1qa+ 和 CDpr4+) (圖 1j杠输、圖 2a-f)赎败。我們可以在 H3K27me3 scCUT&Tag 中識別相似的種群,并使用在標(biāo)記基因區(qū)域附近缺乏抑制標(biāo)記的標(biāo)記組合對它們進行注釋(圖 1j蠢甲、圖 2b僵刮、d-f)。
在完成了細胞類型鑒定之后鹦牛,作者發(fā)現(xiàn)聚類在生物學(xué)重復(fù)中具有高度可重復(fù)性搞糕,來自 P15/P25 年齡的細胞在聚類內(nèi)很好地混合。OLG 譜系的細胞狀態(tài)反映了小鼠的年齡能岩,大多數(shù) OPCs 來自 P15寞宫,分化的 OLG 來自 P25。有趣的是拉鹃,我在 Sox10:Cre/RCE 小鼠的 GFP+ 部分中檢測到一個主要的、可能是瞬時的 AST 群體鲫忍,最有可能來自腹側(cè)區(qū)域(ventral regions)膏燕。
圖1:細胞類型鑒定注釋
圖2:基于scCUT&Tag標(biāo)記區(qū)域的細胞亞群從頭鑒定
3、scCUT&Tag 數(shù)據(jù)與單細胞基因表達的整合
為了驗證亞群的手動注釋的準(zhǔn)確性悟民,我們使用了青春期小鼠大腦 scRNA-seq atlas1坝辫。我們?yōu)檫x定的群體挑選了100個最特異表達的標(biāo)記基因,生成元基因模塊射亏,然后計算模塊內(nèi)的基因活性評分(基因體和啟動子中的 scCUT&Tag 信號)近忙。我們發(fā)現(xiàn)特定細胞簇顯示出主動修飾的元基因信號富集,并且在 H3K27me3 數(shù)據(jù)集中耗盡智润,證明了亞群注釋的準(zhǔn)確性及舍。此外,作者在單細胞水平上使用典型相關(guān)分析 (CCA) 將 H3K4me3 scCUT&Tag 與 scRNA-seq 數(shù)據(jù)進行整合窟绷,發(fā)現(xiàn)主要細胞群與相應(yīng)的 scRNA-seq 群聚在一起(圖3a)锯玛。最后,使用基因本體 (GO) 術(shù)語分析對 H3K4me3 scCUT&Tag 簇進行功能注釋兼蜈,并發(fā)現(xiàn)了 不同的GO通路富集攘残,例如星形膠質(zhì)細胞分化和激活 (AST)、髓鞘形成 (OLG)为狸、髓鞘形成調(diào)節(jié) (OEC)歼郭、參與血管生成的細胞遷移(VAS)、神經(jīng)膠質(zhì)細胞發(fā)育 (OPCs)辐棒、神經(jīng)元發(fā)育病曾、神經(jīng)元成熟和軸突生成 (NEU) 以及參與免疫反應(yīng)的小膠質(zhì)細胞激活 (MGL)在各自的亞群中被富集到牍蜂。
之前的一項研究表明,可以在少突膠質(zhì)細胞群中檢測到更多的細胞亞型知态。作者想到是否可以通過將 scCUT&Tag 數(shù)據(jù)與現(xiàn)有OLG scRNA-seq 數(shù)據(jù)集集成來解決這種異質(zhì)性捷兰。為此,作者使用 CCA 整合了H3K4me3 scCUT&Tag和 scRNA-seq负敏,獲得了較為理想的整合結(jié)果贡茅,并且保留了 scRNA-seq 聚類結(jié)果(圖3b)。然后作者使用 OPC其做、MFOL顶考、MOL1、MOL2 和 MOL5 的元基因評分來揭示 H3K4me3 scCUT&Tag 數(shù)據(jù)中的細胞亞型特征妖泄,有趣的是驹沿,作者發(fā)現(xiàn)看起來同質(zhì)的少突膠質(zhì)細胞群可以進一步解卷積為富含模塊特異性基因的亞群(圖 3c),表明少突膠質(zhì)細胞異質(zhì)性反映在表觀遺傳水平蹈胡。
圖3:H3K4me3 scCUT&Tag數(shù)據(jù)與小鼠腦圖譜 scRNA-seq數(shù)據(jù)的整合分析
4渊季、單細胞群中組蛋白修飾的全局差異和全基因組模式
由于 scCUT&Tag配置文件是針對所有現(xiàn)有亞群同時生成的,因此可以對其全局和全基因組的組蛋白修飾模式進行定量分析罚渐。作者使用每個細胞的唯一reads數(shù)作為單個細胞中組蛋白修飾絕對量的代表却汉。并且發(fā)現(xiàn)在不同亞群間這方面存在很大差異(圖3d)。這對于H3K27me3最為突出荷并,相對于其他群體合砂,它富含少突膠質(zhì)細胞、小膠質(zhì)細胞和一部分神經(jīng)元(圖3d)源织。少突膠質(zhì)細胞中H3K27me3的富集與最近的發(fā)現(xiàn)一致翩伪,即H3K27me3在發(fā)育過程中驅(qū)動少突膠質(zhì)細胞 - 星形膠質(zhì)細胞的轉(zhuǎn)換。有趣的是谈息,我們還在未成熟少突膠質(zhì)細胞群(OPC/COP-NFOL 階段)中觀察到相對較高量的 H3K36me3(圖3d)缘屹。盡管細胞類型中抗體特異性信號全局水平的異質(zhì)性可能是由不同的滲透性和/或標(biāo)記引起的,但我們沒有注意到特定細胞類型中所有組蛋白修飾的信號富集一致黎茎。因此囊颅,信號異質(zhì)性不太可能是由細胞類型之間的差異標(biāo)記效率引起的,而是由細胞類型之間的不同修飾水平造成的傅瞻。作者接下來好奇是否可以在不同的活性修飾中分配細胞群并將它們相互關(guān)聯(lián)踢代。由此,作者使用CCA以基因分辨率整合數(shù)據(jù)嗅骄。引人注目的是胳挎,所獲得數(shù)據(jù)的二維即可以高精度重現(xiàn)了原始的非監(jiān)督聚類(圖3e),并且在不同數(shù)據(jù)集中用相同細胞類型注釋的亞群在空間上的位置也類似(圖3e)溺森。為了進一步檢查活性標(biāo)記和抑制標(biāo)記之間的相互作用慕爬,作者確定了對由H3K4me3標(biāo)記的個體群體特異的所有活性啟動子窑眯,并繪制了所有群體的每個簇的 H3K4me3(圖3f)和 H3K27me3(圖3g)的信號。正如預(yù)期的那樣医窿,當(dāng)啟動子富含 H3K4me3 時磅甩,可以觀察到 H3K27me3 耗盡(圖3g)。有趣的是姥卢,作者注意到星形膠質(zhì)細胞特異性基因在OPCs中比在 MOLs 中具有更高的H3K4me3信號(圖3f)卷要。此外,H3K27me3信號從MOL中的 OPC特異性基因中耗盡独榴,但在星形膠質(zhì)細胞中沒有(圖3g)僧叉,表明H3K27me3在MOL分化過程中不需要抑制OPC基因。相比之下棺榔,H3K27me3信號存在于OPC和MOL的AST特異性基因中(圖3g)瓶堕。最近有報道稱,H3K27me3的中斷會損害 OPC向MOL的分化症歇,并觸發(fā)向星形細胞命運的轉(zhuǎn)變郎笆。此外,所呈現(xiàn)的表觀遺傳圖譜表明AST在表觀遺傳上(H3K4me3)與 OPCs相關(guān)忘晤。
5题画、少突膠質(zhì)細胞分化后H3K4me3的寬度增加
H3K4me3標(biāo)記的廣度之前與各種細胞類型、基因表達和轉(zhuǎn)錄一致性相關(guān)聯(lián)德频。我們在H3K4me3堆積分析中注意到,與其他亞群的標(biāo)記基因啟動子相比缩幸,亞群特異性標(biāo)記基因啟動子的H3K4me3信號的幅度和寬度都增加了(附圖2)壹置。為了量化廣度,作者專門研究了從scRNA-seq數(shù)據(jù)中識別出的標(biāo)記基因的啟動子表谊。作者發(fā)現(xiàn)已鑒定種群的標(biāo)記基因平均具有更高的H3K4me3寬度(圖4a)钞护。此外,單個細胞類型的寬度大小不同爆办,AST和少突膠質(zhì)細胞的啟動子上的H3K4me3峰最寬难咕,血管和軟腦膜細胞?(VLMC) 和OPCs上的峰最窄(圖4b),這可能表明從祖細胞狀態(tài)到完全分化狀態(tài)的轉(zhuǎn)變過程中H3K4me3的寬度增加距辆。為了進一步研究H3K4me3傳播的動態(tài)余佃,作者基于scCUT&Tag,以單細胞分辨率可視化H3K4me3的傳播跨算,并在從OPCs分化MOL的過程中研究了H3K4me3的廣度爆土。作者圍繞MOL特異性標(biāo)記基因生成了單細胞H3K4me3元基因圖譜。然后我們根據(jù)來自MOL中表達的基因的H3K4me3 信號(MOL簽名)對矩陣中的細胞(OPC和 MOL)進行排序诸蚕,并通過擬時序分析進行驗證(圖 4c步势、d)氧猬。引人注目的是,可以觀察到H3K4me3信號在MOL啟動子處的寬度逐漸增加坏瘩,具有單細胞分辨率(圖4e)盅抚,這與H3K4me3隨著細胞向分化的少突膠質(zhì)細胞特征進展時的擴散一致。
圖 4:在單細胞分辨率下H3K4me3標(biāo)記在啟動子上的傳播
附圖2:四種組蛋白修飾的亞群的scCUT&Tag表達
6倔矾、scCUT&Tag of TFs
眾所周知妄均,在low input樣本中使用ChIP-seq很難分析 TF 結(jié)合。因此破讨,作者好奇scCUT&Tag是否能夠以單細胞分辨率揭示 TF 的結(jié)合丛晦,于是他們選擇了TFs OLIG2,其對神經(jīng)膠質(zhì)群體具有特異性提陶,另外選擇了RAD21,其是一種通用染色質(zhì)結(jié)構(gòu)因子和cohesin復(fù)合物的亞基烫沙。作者對出生后第 25 天的小鼠的大腦的GFP+分選細胞進行了scCUT&Tag。與組蛋白修飾相比隙笆,TF scCUT&Tag 的每個細胞的獨特讀取數(shù)較低锌蓄。盡管如此,在OLIG2和RAD21 scCUT&Tag獲得唯一reads的中位數(shù)依然在48 and 240撑柔。使用 LSI和UMAP進行降維瘸爽,并獲得了RAD21和OLIG2的特定集群(圖 5a-d)∏Ψ蓿可以看到OLIG2的兩個亞群的唯一reads的差別交大剪决,作者將具有低唯一reads的集群注釋為“l(fā)ow binders”(圖 5a)。由于在TF CUT&Tag中基于標(biāo)記手動注釋種群具有挑戰(zhàn)性(圖 5e)檀训,基于亞群注釋的假設(shè)是特定細胞類型中的OLIG2/RAD21結(jié)合與增強子/啟動子活性相關(guān)柑潦。因此,作者分析了OLIG2/RAD21 在scCUT&Tag數(shù)據(jù)中被H3K4me3特異性修飾的基因的啟動子區(qū)域中的結(jié)合峻凫,并確定了RAD21 scCUT&Tag中的 AST渗鬼、OLG 和OEC群以及OLIG2 scCUT&Tag 中的OLG和非OLG(“l(fā)ow binders”)。OLIG2 scCUT&Tag中的OLG種群可能由成熟的OLG和OPC組成荧琼,它們似乎在OLG 集群中形成了一個亞種群譬胎。為了進一步分辨亞群注釋,作者將RAD21/OLIG2與另一種組蛋白修飾(使用CCA的H3K27ac)整合命锄,發(fā)現(xiàn)識別的簇始終與相應(yīng)的H3K27ac簇合并堰乔。有趣的是,“l(fā)ow binders”中非OLG 細胞隨機與H3K27ac定義的OEC累舷、AST 和血管細胞簇群合并浩考,而OLG簇與OLG H3K27ac 信號特異性合并。這一發(fā)現(xiàn)與Olig2 在整個細胞類型中的表達一致被盈,它在整個OLG 譜系中高度表達析孽,而 OEC和VLMC不表達Olig2搭伤,只有一小部分AST表達Olig2(圖 5f)。
為了驗證scCUT&Tag的特異性袜瞬,作者在 RAD21和OLIG2的合并偽批量數(shù)據(jù)集中使用 MEME 套件在結(jié)合位點中搜索了富集的基序怜俐。作者發(fā)現(xiàn)染色質(zhì)結(jié)構(gòu)因子CTCF的基序在RAD21數(shù)據(jù)集中最高富集(圖5g),這與CTCF和 cohesin 之間的協(xié)同性一致邓尤。我們發(fā)現(xiàn)了幾個富含OLIG2 scCUT&Tag的基序拍鲤,包括CAGMTG基序,類似于先前在小鼠 ?和大鼠中分別對OLIG2特異的 CAGMTG/CAGCTG基序(圖 5h)汞扎。連同先前確定的OLIG2基序季稳,作者發(fā)現(xiàn)了多種通用真核增強子和啟動子特征(GC框和CAAT框)的富集。有趣的是澈魄,作者還發(fā)現(xiàn)了一個類似于來自SOX家族的TF的基序(ACARWR景鼠,擴展數(shù)據(jù)圖 9f),這與OLIG2和SOX家族TF(SOX8痹扇、SOX10)成員之間的物理相互作用和協(xié)同性一致.
圖 5:轉(zhuǎn)錄因子結(jié)合的 scCUT&Tag 分析
總結(jié)?
篇幅原因铛漓,今天就先介紹到這里,這篇文章的亮點頗多鲫构,基于微流控的單細胞CUT&Tag可以更加特異的分析單細胞水平的各種修飾情況浓恶;與不同的單細胞數(shù)據(jù)的結(jié)合分析為探究更精細的細胞異質(zhì)性提供了思路,對于研究復(fù)雜樣本與組織的老師同學(xué)們值得借鑒结笨。