文獻(xiàn)
2021
Molecular Plant
Single-nucleus RNA and ATAC sequencing reveals the impact of chromatin accessibility on gene expression in Arabidopsis roots at the single-cell level
研究背景
組成植物的各種細(xì)胞類型的獨(dú)特生物學(xué)功能取決于它們對(duì)相同基因組信息的不同使用,具體而言是產(chǎn)生細(xì)胞類型特異性的轉(zhuǎn)錄譜絮蒿。基因組信息在細(xì)胞之間和細(xì)胞類型之間的不同使用被認(rèn)為部分依賴于不同的染色質(zhì)可及性。人類ENCODE項(xiàng)目最近發(fā)現(xiàn),在單細(xì)胞水平上建立染色質(zhì)景觀對(duì)揭示假定的轉(zhuǎn)錄因子結(jié)合位點(diǎn)具有很重要的作用抓韩。在動(dòng)物科學(xué)中饰豺,單細(xì)胞RNA測(cè)序(scRNA-seq)和單細(xì)胞ATAC-seq技術(shù)已成功應(yīng)用于各種細(xì)胞類型和組織,以更好地了解染色質(zhì)可及性對(duì)基因表達(dá)的影響氛濒。
scRNA-seq方法已應(yīng)用于擬南芥根原生質(zhì)體产场,可以準(zhǔn)確表征數(shù)千個(gè)細(xì)胞的轉(zhuǎn)錄譜及其在突變體或應(yīng)激反應(yīng)中的差異調(diào)控。這些研究揭示了單細(xì)胞技術(shù)在建立各種擬南芥根細(xì)胞和細(xì)胞類型的轉(zhuǎn)錄組圖譜以及細(xì)胞發(fā)育過(guò)程中基因表達(dá)的動(dòng)態(tài)調(diào)控方面的優(yōu)勢(shì)舞竿。然而京景,利用植物原生質(zhì)體做單細(xì)胞測(cè)序存在一些問(wèn)題,如某些細(xì)胞類型對(duì)細(xì)胞壁消化有抵抗力骗奖、提取原生質(zhì)體過(guò)程本身對(duì)基因表達(dá)有顯著影響确徙、對(duì)較小的細(xì)胞/原生質(zhì)體的測(cè)序存在偏見(jiàn)等。?
作為原生質(zhì)體的替代品执桌,大量的植物細(xì)胞核被用來(lái)從植物細(xì)胞中獲取轉(zhuǎn)錄組信息鄙皇。例如,通過(guò)分離水稻根仰挣、擬南芥胚胎和種子胚乳上特定細(xì)胞類型標(biāo)記的細(xì)胞核技術(shù)伴逸,從細(xì)胞核群體中建立轉(zhuǎn)錄組。然而膘壶,單細(xì)胞核測(cè)序也存在一些問(wèn)題错蝴,如snRNA-seq會(huì)有檢測(cè)到的基因偏少的風(fēng)險(xiǎn)。并且颓芭,使用完好無(wú)損技術(shù)的前提是鑒定細(xì)胞類型特異性標(biāo)記基因來(lái)表達(dá)報(bào)告基因顷锰,并且需要產(chǎn)生轉(zhuǎn)基因材料。
結(jié)論1 擬南芥根部單細(xì)胞核轉(zhuǎn)錄組數(shù)據(jù)集
Fig 1a
對(duì)擬南芥幼苗根系的細(xì)胞核進(jìn)行純化亡问,并使用10X Genomics Chromium平臺(tái)構(gòu)建sNucRNA-seq文庫(kù)官紫,在5個(gè)獨(dú)立的生物重復(fù)中,作者對(duì)10548個(gè)細(xì)胞核的轉(zhuǎn)錄組進(jìn)行了測(cè)序州藕。由于一些核轉(zhuǎn)錄本可能不會(huì)剪接束世,我們采用了“pre-mRNA”策略以包含內(nèi)含子。每個(gè)細(xì)胞核中平均有1124個(gè)表達(dá)基因床玻,一共鑒定出24 510個(gè)表達(dá)基因(占擬南芥蛋白編碼基因的89.4%)良狈。相比之下,Ryu等人選擇的7437個(gè)擬南芥原生質(zhì)體的轉(zhuǎn)錄組可在每個(gè)細(xì)胞中檢測(cè)到4739個(gè)表達(dá)基因笨枯,共檢測(cè)到25177個(gè)表達(dá)基因(91.8%)薪丁。與細(xì)胞核相比,每個(gè)原生質(zhì)體中鑒定的表達(dá)基因數(shù)量更多馅精,這是由于一個(gè)細(xì)胞中的ployA轉(zhuǎn)錄本比一個(gè)細(xì)胞核中的ployA轉(zhuǎn)錄本更多严嗜、更復(fù)雜。這一猜想還表明洲敢,核轉(zhuǎn)錄組代表了基因動(dòng)態(tài)轉(zhuǎn)錄活性的快照漫玄,而細(xì)胞轉(zhuǎn)錄組可能代表了基因活性隨時(shí)間的整合。
為了評(píng)估從sNucRNA-seq數(shù)據(jù)中獲得的核轉(zhuǎn)錄組的生物學(xué)意義,作者對(duì)scRNA-seq和sNucRNA-seq和bulk RNA-seq進(jìn)行了相關(guān)性分析睦优。相關(guān)性結(jié)果表明擬南芥根的sNucRNA-seq與整個(gè)根的bulk 轉(zhuǎn)錄組的相關(guān)性與scRNA-seq的相關(guān)性一樣高渗常。
利用Seurat包集成獨(dú)立數(shù)據(jù)集的能力,作者根據(jù)10 548個(gè)擬南芥根核與7437個(gè)擬南芥根原生質(zhì)體的轉(zhuǎn)錄組學(xué)特征將它們共聚在一起(Fig 1a汗盘,藍(lán)色為單核數(shù)據(jù)皱碘,橙色為單細(xì)胞數(shù)據(jù))。
Fig 1b
Fig S2
利用UMAP降維隐孽,將擬南芥根不單核核單細(xì)胞數(shù)據(jù)分成21個(gè)20個(gè)不同的簇(Fig 1b是單核核單細(xì)胞合并后的數(shù)據(jù)癌椿,F(xiàn)ig S2中橙色為單細(xì)胞,藍(lán)色為單核)菱阵,cluster14是單核中特有的踢俄。
Fig 1c
Fig 1c展示了21個(gè)cluster的重疊分布,其中cluster4和11在單細(xì)胞核中更豐富晴及,cluster14只存在單細(xì)胞核中都办,其他簇在單細(xì)胞中更豐富。
這些結(jié)果表明虑稼,scRNA-seq和sNucRNA-seq提供了相似的轉(zhuǎn)錄組信息琳钉,表明可以利用分離的植物細(xì)胞核在單細(xì)胞水平上建立有意義的轉(zhuǎn)錄組信息。此外动雹,與scRNA-seq相比槽卫,sNucRNA-seq方法捕獲了更具多樣性和代表性的擬南芥根細(xì)胞類型群體跟压。
結(jié)論2 擬南芥根部不同細(xì)胞簇的功能
Fig 2
作者整理了101個(gè)marker基因胰蝠,然后根據(jù)它們的表達(dá)量對(duì)21個(gè)細(xì)胞cluster進(jìn)行注釋。這一策略使我們能夠表征六大類細(xì)胞:毛體細(xì)胞(簇1-3)震蒋、成膜細(xì)胞(簇4-7)茸塞、分生細(xì)胞(簇8-10)、皮層細(xì)胞(簇11和12)查剖、內(nèi)胚層細(xì)胞(簇13-16)和柱狀細(xì)胞(簇17-21)钾虐。此外,根據(jù)標(biāo)記基因的表達(dá)模式笋庄,我們可以劃分韌皮部和木質(zhì)部(Fig 2a)效扫。
與之前報(bào)告中提到的t-SNE技術(shù)相比,UMAP技術(shù)生成的簇的拓?fù)浣Y(jié)構(gòu)揭示了細(xì)胞類型內(nèi)部和細(xì)胞類型之間的細(xì)胞和細(xì)胞核的功能組織直砂。例如菌仁,根的分生細(xì)胞(即簇8 - 10)定位在UMAP圖的中心(Fig 2a)。從這些分生細(xì)胞開(kāi)始静暂,幾個(gè)細(xì)長(zhǎng)的細(xì)胞突起(如簇3济丘、6、7、12和13)以更多的球狀細(xì)胞團(tuán)(如簇1摹迷、2疟赊、5、11峡碉、15和18)結(jié)束近哟。細(xì)長(zhǎng)的簇可能反映了細(xì)胞分化過(guò)程中轉(zhuǎn)錄組程序的進(jìn)行性變化,而球狀簇代表了組成擬南芥根的分化細(xì)胞异赫。
Fig S7
為了評(píng)估是否可以單獨(dú)分析sNucRNA-seq數(shù)據(jù)來(lái)解碼組織異質(zhì)性椅挣,以達(dá)到與scRNAseq數(shù)據(jù)相似的水平,作者獨(dú)立分析了擬南芥根核和原生質(zhì)體的聚類塔拳。
使用相同的聚類參數(shù)鼠证,sNucRNA-seq和scRNA-seq數(shù)據(jù)分別鑒定出19個(gè)和17個(gè)聚類(Fig S7)。這些結(jié)果表明靠抑,核轉(zhuǎn)錄組足以揭示擬南芥根系的組織異質(zhì)性量九。
Fig S8
Cluster14可以細(xì)分成cluster14a(內(nèi)胚層)和cluster14b(皮層)。AT1G61590(PBL15)颂碧、AT2G40160(TBL30)荠列、AT2G48130和AT4G17215是內(nèi)胚層的marker基因,AT5G18840和AT3G21670(NPF6.4/ NRT1.3)是皮質(zhì)的marker基因(Fig S8)载城。Cluster14a具有編碼氧化物酶的基因和具有GDSL基序的基因肌似。GDSL家族可以控制細(xì)胞分化過(guò)程,說(shuō)明clauster14a可能由分化的細(xì)胞組成诉瓦,這一假設(shè)得到了根過(guò)氧化物酶在控制活性氧產(chǎn)生以調(diào)節(jié)細(xì)胞伸長(zhǎng)和分化中的作用的支持川队。UPBEAT1基因(AT2G47270)是過(guò)氧化物酶基因轉(zhuǎn)錄活性和活性氧分布的主要抑制因子,并通過(guò)調(diào)節(jié)細(xì)胞增殖和分化之間的平衡來(lái)負(fù)調(diào)節(jié)擬南芥根尖分生組織的大小睬澡,除了4固额、10、11和14個(gè)集群外煞聪,其他基因都廣泛表達(dá)(Fig S8)斗躏。
除了控制細(xì)胞分化外,GDSL脂肪酶還在角質(zhì)素生物合成中發(fā)揮核心作用昔脯。通過(guò)這些數(shù)據(jù)啄糙,作者還發(fā)現(xiàn)了其他許多優(yōu)先在cluster14a中表達(dá)餅參與木質(zhì)素和角質(zhì)素生物合成的基因,如GPAT5和另一種GDLS基因云稚。之前的研究表明隧饼,在側(cè)根出現(xiàn)的位置以及內(nèi)胚層分化過(guò)程中,木質(zhì)素和角質(zhì)素會(huì)大量沉積碱鳞。綜上所述桑李,UPBEAT1、幾個(gè)編碼過(guò)氧化物酶、GDSL基因和其他亞木質(zhì)素/角質(zhì)素生物合成相關(guān)基因的轉(zhuǎn)錄模式贵白,以及與皮層和內(nèi)胚層標(biāo)記基因活性相關(guān)的基因率拒,表明組成簇14a的細(xì)胞是分化的內(nèi)胚層細(xì)胞,其特征是細(xì)胞壁的精化禁荒。
簇14a中細(xì)胞的轉(zhuǎn)錄組特征來(lái)自于分離的細(xì)胞核猬膨,而不是來(lái)自于分離的原生質(zhì)體,這可能是由于它們細(xì)胞壁的低消化率呛伴,這是亞蛋白和角質(zhì)積累的結(jié)果勃痴。
Fig S9
Cluster14b的特征是表達(dá)皮層中的特異性基因(如AT5G18840和AT3G21670等)。在該cluster中特異性表達(dá)的基因中热康,SCM(AT1G11130)在根表皮細(xì)胞的模式化中起關(guān)鍵作用(Fig S9)沛申。Cluster14b中也存在參與脂質(zhì)代謝的幾個(gè)基因特異性表達(dá)表達(dá)(如AT1G45201(TLL1)和AT5G63560)。膜脂重塑在根毛細(xì)胞分化中也起著重要作用姐军,綜上所述铁材,推測(cè)構(gòu)成cluster14b的皮質(zhì)細(xì)胞在擬南芥表皮根細(xì)胞的分化和成型化中發(fā)揮作用。
Fig S10
cluster4的特征是特異性表達(dá)CEP1 (AT5G50260)和EX1 (AT2G14095)(Fig S10)奕锌,這兩個(gè)基因之前被認(rèn)為是根冠細(xì)胞死亡程序的調(diào)節(jié)因子著觉。此外,作者發(fā)現(xiàn)KIRA1是一個(gè)控制花發(fā)育過(guò)程中細(xì)胞死亡的基因惊暴,在cluster4中特異性表達(dá)饼丘。其他細(xì)胞死亡標(biāo)志基因(即BFN1、RNS3辽话、SCPL48肄鸽、DMP4和PASPA3)也主要在木質(zhì)部簇4和木質(zhì)部簇21的一個(gè)亞群中表達(dá)。
結(jié)論3 單細(xì)胞分辨率ATAC-seq揭示了染色質(zhì)可及性對(duì)基因表達(dá)的影響
Fig S11
盡管體細(xì)胞之間的基因組信息幾乎是相同的屡穗,但為了通過(guò)細(xì)胞類型特異性的轉(zhuǎn)錄基因調(diào)控來(lái)實(shí)現(xiàn)其獨(dú)特的生物學(xué)功能贴捡,需要基因組信息的不同使用忽肛,特別是通過(guò)細(xì)胞之間不同的染色質(zhì)可及性來(lái)實(shí)現(xiàn)村砂。迄今為止,大量RNA和ATAC-seq數(shù)據(jù)集顯示出較低的相關(guān)性屹逛,這可能是所使用樣本的細(xì)胞異質(zhì)性的結(jié)果础废。這一假設(shè)得到了人類ENCODE項(xiàng)目的支持,該項(xiàng)目最近發(fā)現(xiàn)罕模,在單細(xì)胞水平上建立染色質(zhì)景觀對(duì)揭示假定的TF結(jié)合位點(diǎn)具有很高的信息量评腺。為了更好地評(píng)估染色質(zhì)可及性在控制細(xì)胞和細(xì)胞類型間植物基因表達(dá)中的作用,作者應(yīng)用10X Genomics的sNucATAC-seq技術(shù)對(duì)兩個(gè)獨(dú)立生物重復(fù)分離的擬南芥根核進(jìn)行了分析淑掌。在6768個(gè)核中蒿讥,4764個(gè)通過(guò)了質(zhì)控(Fig S11)。
Fig S12
每個(gè)細(xì)胞核中有10 253個(gè)獨(dú)立的基因組DNA片段被映射到擬南芥基因組中,總共表征了20 803個(gè)可訪問(wèn)的位點(diǎn)芋绸。在20803個(gè)可訪問(wèn)的位點(diǎn)中媒殉,作者分別鑒定出3487個(gè)和15730個(gè)位點(diǎn)具有細(xì)胞類型特異性峰和“靜態(tài)”峰特征(Fig S12)。
Fig 3a-b
染色質(zhì)的可及性區(qū)域大多位于轉(zhuǎn)錄起始位點(diǎn)上游1000 bp區(qū)間摔敛,其中包含順式調(diào)控元件(Fig 3a)和基因的轉(zhuǎn)錄終止位點(diǎn)周圍(Fig 3b)廷蓉。
Fig 3c
考慮到可及性染色質(zhì)區(qū)域是促進(jìn)基因表達(dá)的先決條件,我們預(yù)計(jì)位于TSS附近的細(xì)胞類型特異性ATAC-seq峰有助于調(diào)節(jié)特定細(xì)胞的marker基因的表達(dá)马昙。因此桃犬,作者使用Signac軟件包整合sNucATAC-seq和sc/sNucRNA-seq,在細(xì)胞類型特異性背景下表達(dá)的基因TSS附近尋找染色質(zhì)開(kāi)放區(qū)域行楞。該策略鑒定出11858個(gè)具有RNAseq和ATAC-seq配對(duì)峰的基因攒暇,并創(chuàng)建了21個(gè)與sc/sNucRNA-seq簇對(duì)應(yīng)的sNucATAC-seq簇(Fig 3c)。
Fig S14
為了評(píng)估使用sc/sNucRNA-seq數(shù)據(jù)集根據(jù)擬南芥細(xì)胞核的染色質(zhì)可接近性特征對(duì)其進(jìn)行聚類的影響子房,作者根據(jù)細(xì)胞核開(kāi)放染色質(zhì)的差異峰對(duì)其進(jìn)行了重新聚類(Fig S14)扯饶,這種方法再次鑒定出21個(gè)與我們集成的sNucATAC-seq和sc/ sNucRNA-seq分析鑒定出的集群分布略有不同的集群。這一結(jié)果表明池颈,染色質(zhì)可及性譜足以揭示擬南芥根細(xì)胞的細(xì)胞復(fù)雜性尾序。
Fig 3d-e
為了更好地評(píng)價(jià)sNucATAC-seq與bulk ATAC-seq數(shù)據(jù)集的分辨率,作者首先比較了擬南芥根核在一個(gè)位置(chr1: 21 067 500-21 103 000)生成的sNucATAC-seq和bulk ATAC-seq躯砰。在21個(gè)簇中每币,我們可以清楚地識(shí)別出由bulk ATAC-seq技術(shù)顯示的相同的主要峰(Fig 3d)。此外琢歇,sNucATAC-seq方法還發(fā)現(xiàn)兰怠,在這21個(gè)簇的亞群中,有更多的主峰李茫。例如揭保,在sNucATAC-seq簇14和15中,AT1G56320的啟動(dòng)子區(qū)域出現(xiàn)了ATAC-seq峰(Fig 3d)魄宏,AT1G56320在這兩個(gè)集群中特異性表達(dá)(Fig 3e)秸侣,表明單細(xì)胞分辨率的ATAC-seq分析有可能揭示可接近染色質(zhì)的離散和細(xì)胞類型特異性位點(diǎn)。
Fig 4
接下來(lái)宠互,作者試圖將單細(xì)胞的染色質(zhì)可及性與單細(xì)胞的基因表達(dá)關(guān)聯(lián)起來(lái)味榛。在對(duì)scRNA-seq和sNucRNA-seq數(shù)據(jù)集進(jìn)行挖掘后,根據(jù)其與其他簇的表達(dá)倍數(shù)變化和最低p值予跌,從每個(gè)簇中選出前20個(gè)標(biāo)記基因搏色。由于簇之間存在冗余,最終一共鑒定出370個(gè)獨(dú)特的marker基因券册,其中336個(gè)在其TSS附近至少有一個(gè)sNucATAC-seq峰频轿。作者還選取了811個(gè)在擬南芥根部各個(gè)細(xì)胞類型中都表達(dá)的管家基因作為對(duì)照垂涯。
對(duì)marker基因的非正態(tài)分布數(shù)據(jù)應(yīng)用Kendall ‘s taub秩相關(guān)檢驗(yàn),觀察到幾乎所有sc/ sNucRNA-seq和sNucATAC-seq數(shù)據(jù)集之間都存在顯著的正相關(guān)(Fig 4 a為單細(xì)胞航邢,b為單核)集币,這一結(jié)果支持了差異染色質(zhì)可及性與marker基因的表達(dá)模式相關(guān)的觀點(diǎn)〈渲遥基于這些結(jié)果鞠苟,我們假設(shè),與它們的轉(zhuǎn)錄活性相似秽之,所選基因在TSS位置的染色質(zhì)可接近性可以用作細(xì)胞類型識(shí)別的分子標(biāo)記当娱。相比之下,對(duì)照中只有少數(shù)顯著和較中等的相關(guān)性考榨。
以上結(jié)果說(shuō)明跨细,核小體在基因組DNA雙鏈上靠近基因TSS的位置,在控制至少一部分標(biāo)記基因的活性方面起著關(guān)鍵作用河质。
結(jié)論4單細(xì)胞分辨率下的染色質(zhì)可接近性可以作為指示根毛和內(nèi)胚層細(xì)胞發(fā)育狀態(tài)的分子標(biāo)記
Fig 5
植物的細(xì)胞類型是根據(jù)marker基因的表達(dá)譜來(lái)標(biāo)注的冀惭,通過(guò)前一部分的分析說(shuō)明單細(xì)胞的染色質(zhì)可及性也可以作為一種marker來(lái)標(biāo)記細(xì)胞類型。為了進(jìn)一步驗(yàn)證這一假設(shè)掀鹅,作者利用單細(xì)胞分辨率ATAC-seq數(shù)據(jù)集散休,重點(diǎn)分析了代表成熟擬南芥根毛和內(nèi)胚層細(xì)胞的3個(gè)和4個(gè)簇(cluster1、cluster2乐尊、cluster3和cluster13戚丸、cluster14、cluster15扔嵌、cluster16限府,F(xiàn)ig 2)。
在與擬南芥基因TSS配對(duì)的11858個(gè)sNucATAC-seq峰中痢缎,分別有20個(gè)和26個(gè)在根毛和內(nèi)胚層cluster中被特異性鑒定胁勺。利用scRNA-seq和sNucRNAseq數(shù)據(jù)集,作者分別鑒定出19個(gè)(95%)和25個(gè)(96.2%)基因在擬南芥根毛和內(nèi)胚層細(xì)胞中優(yōu)先表達(dá)(即該基因在根毛或內(nèi)胚層超簇中的表達(dá)至少等于該基因在其余5個(gè)大簇中的表達(dá)独旷,F(xiàn)ig5 a是單核署穗,b是單細(xì)胞),說(shuō)明染色質(zhì)可及性可以作為一種分子標(biāo)記來(lái)注釋特定的細(xì)胞類型势告。
總結(jié)
(1)作者首次驗(yàn)證了通過(guò)分離擬南芥根部核以獲取單細(xì)胞水平基因表達(dá)信息的可靠性蛇捌。?
(2)在單細(xì)胞水平上提供了轉(zhuǎn)錄組學(xué)和染色質(zhì)可及性數(shù)據(jù)的整合抚恒。(3)證明了單細(xì)胞水平的特異的染色質(zhì)可及性可以作為一種marker來(lái)鑒定細(xì)胞類型咱台。?