A cis-regulatory atlas in maize at single-cell resolution
關(guān)鍵詞:chromatin械蹋;single-cell;epigenomics;maize辕翰;gene regulation橡庞;ATAC-seq;plant development菱肖;pseudotime;transcription factor旭从;cis-regulatory elements
原文鏈接:https://www.sciencedirect.com/science/article/pii/S0092867421004931
背景:
- 什么是順式作用元件(cis-regulatory elements, CREs):
一段與結(jié)構(gòu)基因串聯(lián)的非編碼DNA序列稳强,一般位于轉(zhuǎn)錄點(diǎn)上游,作用是調(diào)節(jié)鄰近基因的轉(zhuǎn)錄和悦。CREs是遺傳調(diào)控網(wǎng)絡(luò)的重要組成部分退疫,進(jìn)而控制形態(tài)發(fā)生、解剖學(xué)的發(fā)展以及胚胎發(fā)育的其他方面鸽素。 - CREs褒繁、TF與染色質(zhì)可及性之間的關(guān)系:
(1) CRE 活性受核小體占有率的影響;大多數(shù) TF 需要核小體耗盡的可接近染色質(zhì)來結(jié)合其靶序列;
(2) 轉(zhuǎn)錄結(jié)果由核心啟動子與特定 TF 在 CREs上 組裝的二級蛋白之間的相互作用決定;
(3) 不同的 TF 表達(dá)和染色質(zhì)可及性模式建立了細(xì)胞類型特異性的基因表達(dá)調(diào)控模式付鹿。
因此澜汤,不同細(xì)胞類型中 CREs 和 TF 的詳細(xì)圖譜對于了解細(xì)胞功能和個(gè)體發(fā)育具有重要價(jià)值蚜迅。 - 植物學(xué)領(lǐng)域TF和CREs研究的局限性:
(1) 細(xì)胞壁施加的技術(shù)限制
(2)無法培養(yǎng)細(xì)胞系
植物中單個(gè)細(xì)胞的表觀組學(xué)分析僅局限于擬南芥根部的研究舵匾。(Dorrity et al., 2020; Farmer et al., 2020). - CREs的遺傳變異可能是新表型產(chǎn)生的主要來源,能夠?yàn)楝F(xiàn)在育種提供重要參考谁不。
在這篇文章中坐梯,作者通過scATAC-seq分析,繪制了遺傳模型和作物物種玉米的單細(xì)胞分辨率的Cis調(diào)節(jié)圖譜刹帕,分析了6個(gè)玉米組織中92種單細(xì)胞染色質(zhì)可及性模式吵血,揭示了協(xié)調(diào)染色質(zhì)相互作用的 TF和非細(xì)胞自主活性TF,并比較了玉米與擬南芥發(fā)育過程中順式調(diào)控動力學(xué)的演變偷溺。
主要結(jié)果
一蹋辅、 玉米中Cis調(diào)控圖譜的組裝
作者使用包括腋芽、雄蕊挫掏、雌花序侦另、幼苗、胚根尖和胚后冠根在內(nèi)的6個(gè)主要器官尉共,進(jìn)行流式分選單細(xì)胞褒傅,提取細(xì)胞核之后進(jìn)行scATAC-seq生成了單細(xì)胞染色質(zhì)可及性圖譜“烙眩總共包括56575個(gè)細(xì)胞核殿托,31660個(gè)Tn5整合位點(diǎn),產(chǎn)生了165913個(gè)ACR(accessible chromatin regions)剧蚣。通過與Bulk ATAC-seq數(shù)據(jù)比較支竹、轉(zhuǎn)錄起始位點(diǎn)富集旋廷、片段大小分布和基因分型混合,反映了高質(zhì)量的scATAC-seq數(shù)據(jù)唾戚。因?yàn)榇蠖鄶?shù) scATAC-seq 分析工具都是針對人類和小鼠基因組量身定制的柳洋,所以作者開發(fā)了一種靈活的、基于物種未知模型的方法叹坦,利用準(zhǔn)二項(xiàng)式邏輯回歸框架將不需要的技術(shù)變異來源刪除的R 包熊镣,Socrates 。
二募书、 細(xì)胞類型注釋和原位雜交
為了識別和注釋每個(gè)簇代表的細(xì)胞類型绪囱,作者進(jìn)行了廣泛的文獻(xiàn)調(diào)研,手動確定了221個(gè)標(biāo)記基因莹捡,同時(shí)也評估了Clusters之間的差異染色質(zhì)可及性鬼吵。已知markergene與背景基因組相比具有顯著的細(xì)胞類型特異性,圖1 E展示了6種不同細(xì)胞類型相關(guān)的Marker gene的細(xì)胞類型特異性的染色質(zhì)可及性篮赢。 圖1 F中展示了花原基齿椅、木質(zhì)部前體、L1表皮細(xì)胞中已知標(biāo)記基因周圍的簇特異性染色質(zhì)可及性启泣。
為了證實(shí)預(yù)測的細(xì)胞類型注釋涣脚,我們對一部分差異可及的基因進(jìn)行了 RNA原位雜交,沒有細(xì)胞類型特異性的先前證據(jù)寥茫。在所有情況下(五分之五)遣蚀,原位表達(dá)模式與基于基因可及性的預(yù)測定位相匹配。
三纱耻、單核染色質(zhì)可及性和基因表達(dá)的整合
為了評估核轉(zhuǎn)錄和染色質(zhì)可及性之間的關(guān)系芭梯,作者對15515個(gè)玉米幼苗核的進(jìn)行了scRNA-seq并與scATAC-seq幼苗數(shù)據(jù)進(jìn)行整合。 scATAC-seq (n = 11,882) 和 snRNA-seq (n = 15,515) 揭示了 19 個(gè)具有相似全基因組圖譜的簇(圖 2 B 和 2C)弄喘【链基因變異性的比較突出了染色質(zhì)可及性和跨簇核轉(zhuǎn)錄的一致模式,例如具有公認(rèn)細(xì)胞類型特異性的標(biāo)記基因(圖 2D, E)蘑志。這些分析表明累奈,染色質(zhì)可及性相對于RNA表達(dá)的變化更大,說明染色質(zhì)結(jié)構(gòu)能為剖析細(xì)胞類型異質(zhì)性提供額外的信息(圖2 G)卖漫。
盡管基因可訪問性和表達(dá)之間存在關(guān)聯(lián)费尽,但作者觀察到一部分可訪問基因缺乏轉(zhuǎn)錄證據(jù)(圖2H),而無可及性基因幾乎完全與DNA甲基化相關(guān)。而另外對于染色質(zhì)可及/沉默基因中ACR的基序分析羊始,富集到了CNN重復(fù)序列旱幼,CNN重復(fù)基序與BPC1基因識別的序列之間存在顯著的重疊,在擬南芥中突委,BPC1轉(zhuǎn)錄因子家族與使用PREs(多梳響應(yīng)元件)和甲基化進(jìn)行基因沉默相關(guān)柏卤。表明某些PRC(多梳抑制復(fù)合物)的基因沉默活動需要具有可及性的PREs(響應(yīng)元件)冬三。
四、CRE的基因組特征
為了探索定義細(xì)胞身份的 CRE缘缚,我們對具有跨細(xì)胞類型的染色質(zhì)可及性的離散模式的 ACR 進(jìn)行了分類勾笆,確定了總共 52,520 個(gè) ACR(31%)。首先通過分析ACR兩側(cè) 2-kb 區(qū)域的相對DNA甲基化水平(圖 3A)桥滨,發(fā)現(xiàn)ACR 相對于周圍區(qū)域顯著低甲基化窝爪。通過自轉(zhuǎn)錄活性調(diào)節(jié)區(qū)測序發(fā)現(xiàn),相對于對照和非特異性 ACR齐媒,簇特異性 ACR 與顯著更強(qiáng)的增強(qiáng)子活性相關(guān)(圖 3B)蒲每。 ACR與基因距離的分布圖顯示(圖 3C),大量的ACR位于基因遠(yuǎn)端喻括,并且遠(yuǎn)端ACR與LTR(長末端重復(fù))反轉(zhuǎn)錄轉(zhuǎn)座子存在大量重疊邀杏。同時(shí)與不可及的LTR相比,與ACR一致的LTR展示出了顯著降低的DNA甲基化水平和更早的插入時(shí)間唬血,并且也具有更高的細(xì)胞類型特異性(圖 D,E,F)望蜡。因此提示我們,LTR在玉米調(diào)控景觀中發(fā)揮了重要的進(jìn)化作用拷恨。
為了查詢表型變異和細(xì)胞類型特異性之間的關(guān)系脖律,我們量化了 ACR 中現(xiàn)存的遺傳變異。與非特異性 ACR 相比挑随,細(xì)胞類型特異性 ACR 的多態(tài)性密度較低(圖 3 G)状您,然而勒叠,嵌入在細(xì)胞類型特異性 ACR 中的遺傳變異更常與全基因組關(guān)聯(lián)研究確定的表型變異相關(guān)(圖 3 H)兜挨,因此,細(xì)胞類型特異性 CRE 的遺傳擾動可能占表型變異的很大一部分眯分。
五拌汇、TF活性的變化定義了不同的細(xì)胞身份
為了建立不同細(xì)胞的 TF 特征,我們鑒定了玉米基因組中的 TF 基序弊决。相對于對照(n = 165,913)和側(cè)翼區(qū)域(圖4A)噪舀,ACR 富含 TF 基序。TF 基序在 ACR 峰內(nèi)被強(qiáng)烈耗盡飘诗,與 TF 結(jié)合序列阻斷 Tn5 整合一致(圖 4A )与倡。為了定義每種細(xì)胞類型的 TF組合,我們評估了每種細(xì)胞類型的前 2,000 個(gè)差異 ACR 中 TF 基序的相對富集昆稿。每種細(xì)胞類型富集了約 43 個(gè) TF 基序組合纺座。我們假設(shè) TF 基序和同源 TF 基因的染色質(zhì)可及性狀態(tài)可用于闡明控制細(xì)胞狀態(tài)的調(diào)控規(guī)則。將 TF 基因可及性與其序列特異性結(jié)合位點(diǎn)的全局富集進(jìn)行比較溉潭,揭示了跨細(xì)胞類型和單個(gè)細(xì)胞核的驚人相似的模式净响,反映了假定活性 TF 的多樣化組合景觀少欺。對富集 TF 及其同源基序的評估確定了已知的細(xì)胞特性調(diào)節(jié)因子,包括根表皮祖細(xì)胞和毛細(xì)胞中的WRKY家族 TF馋贤、實(shí)質(zhì)葉肉中的G2 - like1和AGAMOUS -like和花原基中的SEPALLATA TFs 赞别,以及以前未被認(rèn)識到的細(xì)胞類型調(diào)節(jié)劑作用的 TFs。
六配乓、可共同訪問的ACR反映了體內(nèi)染色質(zhì)的相互作用
scATAC-seq另一個(gè)重要應(yīng)用是可以用來預(yù)測染色質(zhì)結(jié)構(gòu)仿滔。作者利用scATAC-seq數(shù)據(jù)計(jì)算了380萬個(gè)鄰近ACRs的可及性相關(guān)模式,即共可及性ACRs(與基因共表達(dá)相類似的概念)犹芹,例如圖A中展示了tb1基因附近在不同細(xì)胞類型中存在的共可及性ACRs堤撵。為了評估共可及性ACRs和體內(nèi)相互作用的一致性,作者將幼苗時(shí)期的共可及性ACRs與同時(shí)期Hi-C數(shù)據(jù)進(jìn)行了比較羽莺,發(fā)現(xiàn)在包括種子实昨,穗等組織中,共可及性ACR附近有著很強(qiáng)的Hi-C信號盐固,說明共可及性ACR可以用來很好的代表染色質(zhì)環(huán)荒给。
此外作者假設(shè)與H3K4me3和H3K27me3-HiChip染色質(zhì)環(huán)一致的共可及性ACR可能與不同的轉(zhuǎn)錄結(jié)果相關(guān)。因此刁卜,他們比較分析了與這兩種染色質(zhì)環(huán)相關(guān)的基因之間的RNA表達(dá)水平志电,發(fā)現(xiàn)盡管ACR的覆蓋率相似,但與H3K27me3共可及性ACR相關(guān)基因的表達(dá)表達(dá)顯著降低蛔趴,這與兩側(cè)為H3K27me3的基因遠(yuǎn)端的CRE的沉默功能一致(CRE通常為沉默子)挑辆。
七、動態(tài)染色質(zhì)可及性是發(fā)育軌跡的基礎(chǔ)
在這部分中孝情,作者著重分析與發(fā)育軌跡調(diào)控相關(guān)的動態(tài)染色質(zhì)可及性變化鱼蝉。玉米頂端區(qū)域包圍著一組未分化的分生細(xì)胞,這些細(xì)胞到分化細(xì)胞是一個(gè)連續(xù)的發(fā)育過程箫荡。首先他們沿著偽時(shí)間軌跡的對18個(gè)發(fā)育連續(xù)體進(jìn)行了排序魁亦,然后再分析每個(gè)偽時(shí)間軌跡上顯著變化的ACR、TF基因座和TF基序羔挡。圖B中以根韌皮部伴隨細(xì)胞 (PCC) 的發(fā)育軌跡洁奈,展示了他們的分析過程。他們鑒定了與PCC發(fā)育相關(guān)的440個(gè)TF基序绞灼,402個(gè)TF位點(diǎn)和8004個(gè)ACR利术,其中包括了幾個(gè)已知的分生組織和韌皮部發(fā)育相關(guān)基因,例如ARID8,ZmSMXL3,SUT1等等低矮。
八印叁、根系發(fā)育的進(jìn)化
為了探索根發(fā)育過程中的調(diào)控保守程度,我們分析了來自 7 天的擬南芥根組織的 4,655 個(gè)細(xì)胞核的染色質(zhì)可及性,將單核染色質(zhì)圖譜與已發(fā)表的擬南芥根單細(xì)胞 RNA-seq整合在一起喉钢。并構(gòu)建了 8 條順式調(diào)節(jié)偽時(shí)間發(fā)育軌跡姆打。為了進(jìn)行比較分析,他們對擬南芥的PCC進(jìn)行了類似于玉米的分析肠虽,例如圖B中展示的與PCC發(fā)育相關(guān)的440個(gè)TF基序幔戏,265TF位點(diǎn)和3989個(gè)ACR,圖D,E展示幾個(gè)Marker基因表達(dá)和染色質(zhì)可及性情況税课,驗(yàn)證了數(shù)據(jù)分析的可靠性闲延。
通過對比玉米和擬南芥的PCC發(fā)育過程,作者發(fā)現(xiàn)在這兩個(gè)物種中韩玩,10,976 個(gè)推定的直系同源基因中只有 206 個(gè)與 PCC 假時(shí)間相關(guān)(FDR < 0.01)垒玲,表明大多數(shù) PCC 軌跡相關(guān)基因是譜系特異性的。通過動態(tài)時(shí)間扭曲算法來對齊這206個(gè)與PCC發(fā)育軌跡相關(guān)的直系同源基因后找颓,進(jìn)行聚類分析發(fā)現(xiàn)合愈,約50%(102/206)在偽時(shí)間中表現(xiàn)出相似的可及性變化模式,而剩余的直系同源基因則分別在兩個(gè)物種中發(fā)生了不同程度的偏移(圖F,G)击狮。圖H中分別展示了保守的直系同源基因佛析,在玉米中提前開放的基因以及在擬南芥中提前開放的基因,這些結(jié)果反映了玉米和擬南芥的PCC發(fā)育過程中調(diào)控功能的進(jìn)化和新穎性彪蓬。
討論
- 文章通過對6個(gè)玉米器官的92種單細(xì)胞染色質(zhì)可及性模式分析寸莫,繪制了順式作用元件(CRE)編碼時(shí)空基因表達(dá)程序的基因組藍(lán)圖。
- 通過分析TF組合和TF活性和結(jié)合档冬,揭示了大量與細(xì)胞身份建立相關(guān)的順式和反式調(diào)節(jié)因子膘茎。
- 發(fā)現(xiàn)細(xì)胞類型特異性 CRE 在增強(qiáng)子活性和未甲基化的長末端重復(fù)反轉(zhuǎn)錄轉(zhuǎn)座子內(nèi)富集,還是表型相關(guān)遺傳變異的熱點(diǎn)酷誓,并且在現(xiàn)代玉米育種中被選擇披坏,突出了CRE圖譜的生物學(xué)意義。
- 此外呛牲,還通過比較玉米和擬南芥的發(fā)育軌跡刮萌,確定了具有保守和發(fā)散染色質(zhì)動力學(xué)的TF和CRE驮配,展示了基因調(diào)控網(wǎng)絡(luò)的廣泛進(jìn)化娘扩。
- 除了這個(gè)豐富的數(shù)據(jù)集,作者還開發(fā)了單細(xì)胞分析軟件Socrates壮锻,可用于了解任何物種的順式調(diào)節(jié)變異琐旁。