原文:這篇文章是18年4月發(fā)表在Cell上的尉姨, 原文鏈接: Integrated Single-Cell Analysis Maps the Continuous Regulatory Landscape of Human Hematopoietic Differentiation衫画,DOI: https://doi.org/10.1016/j.cell.2018.03.074
概述:
這篇文章整合了scATAC-seq和scRNA-seq數(shù)據(jù)返劲,使用純生信計算的方法,探究造血分化過程中染色質(zhì)的開放狀態(tài)章办、TF motif勉躺、TF expression 及cis-regulatory elements 之間的動態(tài)變化和相互作用。
文章思路:
- 首先利用scATAC-seq數(shù)據(jù)從chromatin accessibility入手更扁,分析造血分化過程染色質(zhì)開放狀態(tài)圖譜的異質(zhì)性;
- 用ChromVAR R包預(yù)測TF的活動;
- 采用多種聚類方法疯潭,如通過TF Z scores利用Hierarchical clustering 和t-SNE聚類赊堪,并采用了reference guided approach面殖,基于bulk sample和算法對單細(xì)胞數(shù)據(jù)進行降維聚類分析竖哩;
- 整合scRNA-seq 和scATAC-seq數(shù)據(jù)分析TF與chromatin accessibility,以及順式調(diào)控元件和鄰近基因的表達的相互關(guān)系脊僚。
數(shù)據(jù)概覽
Datatype | Sample/Platform | Cell type | Data sources |
---|---|---|---|
scATAC-seq | bone marrow | 8 cell populations | this paper |
LMPP+monocytes | Corces et al., 2016 | ||
scRNA-seq | 10X genomics | HSC,CMP,GMP | this paper |
CD34,CD14 monocyte | Zheng et al., 2017 | ||
Bulk ATAC-seq and bulk RNA-seq | Corces et al., 2016 GSE74246 | ||
Promoter capture HiC | CD34+ | Mifsud et al., 2015 | |
Promoter capture HiC | monocytes | Javierre et al., 2016 | |
Cis-eQTL | monocytes | Fairfax et al., 2014 |
背景:
造血分化 是從造血干細(xì)胞分化為具有不同功能的細(xì)胞過程相叁,在成人中主要發(fā)生在骨髓,最終產(chǎn)生淋巴系細(xì)胞(B,T,NK cell),髓系-粒系(monocyte, granulocyte)辽幌,紅系(Ery,mega)等細(xì)胞類型增淹,是研究干細(xì)胞分化、腫瘤免疫乌企、血液疾病等的良好模型虑润。造血分化過程是一個復(fù)雜、多階段的加酵,受多種因子調(diào)控的過程拳喻,單細(xì)胞表觀基因組分析有助于解析造血干細(xì)胞轉(zhuǎn)錄和細(xì)胞命運異質(zhì)性的順式和反式調(diào)節(jié)機制。
ATAC-seq 是2013年由斯坦福大學(xué)William J. Greenleaf和Howard Y. Chang 實驗室開發(fā)的用于研究染色質(zhì)開放程度的方法猪腕, 原理是通過轉(zhuǎn)座酶Tn5容易結(jié)合在開放染色質(zhì)的特性冗澈,然后對Tn5酶捕獲到的DNA序列進行測序。ATAC-seq與傳統(tǒng)的DNase-Seq及FAIRE-seq相比的優(yōu)點是所需細(xì)胞量少陋葡,實驗簡單亚亲,可以在全基因組范圍內(nèi)檢測染色質(zhì)的開放狀態(tài)。
這篇文章的通訊作者也是ATAC-seq開發(fā)者William J. Greenleaf和Howard Y. Chang腐缤,他們實驗室最近幾年發(fā)過好多篇利用ATAC-seq 研究chromatin accessibility的大文章捌归。感興趣的可以看看他們的實驗室主頁,Greenleaf lab和chang lab岭粤。
Nat Methods. 2013 Dec;10(12):1213-8. doi: 10.1038/nmeth.2688. Epub 2013 Oct.
結(jié)果
-
scATAC-seq流程
從健康人捐贈的骨髓中分選單個細(xì)胞惜索,然后細(xì)胞捕獲,轉(zhuǎn)座酶結(jié)合绍在,PCR擴增和測序门扇,得到造血系統(tǒng)10個細(xì)胞類型的染色質(zhì)開放圖譜。
-
ChromVAR 預(yù)測與chromatin accessibility landscape(CAL)變化相關(guān)的TF motif
開放染色質(zhì)通常也被認(rèn)為活性染色質(zhì)偿渡,當(dāng)染色質(zhì)由致密的狀態(tài)解開雙螺旋時臼寄,轉(zhuǎn)錄因子、順式調(diào)控元件等便可以結(jié)合在開放染色質(zhì)區(qū)域溜宽,進而調(diào)控轉(zhuǎn)錄吉拳,因此,由染色質(zhì)的開放狀態(tài)預(yù)測轉(zhuǎn)錄因子的活動适揉,可以進一步研究研究轉(zhuǎn)錄調(diào)控機制留攒。
常見的motif分析流程煤惩,一般首先得到差異peak,然后用homer等軟件預(yù)測motif炼邀,再結(jié)合TF 數(shù)據(jù)庫等魄揉;這里使用的ChromVAR是專門用于分析chromatin accessibility 的一個具有多種功能的R包,其中之一就是鑒定不同細(xì)胞的TF motif拭宁。
通過這種方法發(fā)現(xiàn)了造血分化中主要的調(diào)控因子GATA1, BATF, CEBPB等洛退。
-
多種方法對TF motif聚類
首先利用TF Z scores進行層次聚類(圖A),發(fā)現(xiàn)了HOX TF 在HSC中富集杰标,在其他分化細(xì)胞中低表達兵怯,可能與促進細(xì)胞的干性和多能性有關(guān)。
然后利用t-SNE以TF Z-scores為特征可視化造血分化過程腔剂,可以明顯看到紅系媒区,髓系,淋巴系的分化軌跡掸犬。
但是袜漩,TF Z scores 聚類和TF Z score 與t-SNE結(jié)合聚類的方法都存在缺點:前者不容易鑒定chromatin accessibility 與其他生物變量間的關(guān)系,如細(xì)胞周期登渣,細(xì)胞間的信號依賴噪服;后者對細(xì)胞間距離難以解釋;因此文章中又采用了新的算法——reference guided approach胜茧,即基于bulk sample 的chromatin accessibility 和相關(guān)的調(diào)控元件粘优。原理類似于scRNA-seq中提出的reference component analysis (RCA) 算法(PMID: 28319088,健明師兄前不久剛介紹過這篇文章,單細(xì)胞轉(zhuǎn)錄組探索CRC病人的一致性) 呻顽。首先對bulk ATAC-seq sample進行主成分(PC)分析雹顺,然后對PC在單個細(xì)胞中比例進行打分,最后根據(jù)PCs標(biāo)準(zhǔn)化后的分值與其他細(xì)胞的相關(guān)系數(shù)進行聚類廊遍。
-
從頭鑒定細(xì)胞類型
不知道細(xì)胞表面分子標(biāo)記物嬉愧,利用k-medoids clustering對PC分析中的前5種主要成分聚類。鑒定出14個cluster喉前,大部分與有細(xì)胞標(biāo)記物聚類的結(jié)果重合没酣,并發(fā)現(xiàn)了CMP包含4個cluster 和特有的TF motif如GATA1,BCL11A 和SPI1(PU.1)。
-
轉(zhuǎn)錄組與chromatin accessibility結(jié)合
用10Xgenomics 平臺對HSC,CMP,GMP進行單細(xì)胞測序卵迂,同時使用他人關(guān)于monocyte scRNA-seq數(shù)據(jù)裕便,基于 reference-guided 方法 配對 scATAC-seq 和 scRNAseq profiles 。根據(jù)這種方法见咒,他們將髓系分化基因的動態(tài)表達映射到染色質(zhì)的動態(tài)變化偿衰,并且發(fā)現(xiàn)了已知的髓系分化調(diào)節(jié)因子的預(yù)期表達模式。還將TF的表達與TF motif對比。
-
順式調(diào)控元件與基因表達
共發(fā)現(xiàn)了14,005個順式調(diào)控元件下翎,這些調(diào)控元件隨著染色質(zhì)開放狀態(tài)的變化也呈現(xiàn)顯著的異質(zhì)性缤言。
他們推斷遠端調(diào)控元件的動態(tài)激活模式與附近表達的基因之間的相關(guān)性可用于將增強子與靶基因連接,進而發(fā)現(xiàn)了CEBPD的遠端調(diào)控元件與CEBPD的表達高度相關(guān)视事。整合啟動子捕獲 Hi-C 數(shù)據(jù)胆萧,發(fā)現(xiàn)形式環(huán)可以促進調(diào)控元件與基因的結(jié)合。最后用這些單細(xì)胞數(shù)據(jù)去看cis相關(guān)的數(shù)量表達性狀cis-eQTLs是否與增強子-靶基因相互作用存在overlap,最終發(fā)現(xiàn)cis-eQTL強烈富集scATAC / scRNA-seq相關(guān)峰 - 基因?qū)?在PCHiC環(huán)處只觀察到適度的富集郑口。
思考
純生信分析能發(fā)Cell鸳碧,這篇文章的亮點有:
- 整合了單細(xì)胞表觀組和轉(zhuǎn)錄組兩個熱點分析(scATAC-seq和scRNA-seq);
- 采用了多種算法和新穎的分析方法犬性,如聚類的算法就包括TF Z-scores,t-SNE, K-medoids腾仅, reference guided approach等乒裆,用ChromVAR預(yù)測chromatin accessibility相關(guān)的TF motif;
- 數(shù)據(jù)量非常大推励,還結(jié)合了之前很多bulk sample和sc sample的數(shù)據(jù)鹤耍,以及啟動子捕獲PC HiC 數(shù)據(jù),cis-eQTL數(shù)據(jù)等验辞,
- 轉(zhuǎn)錄調(diào)控機制的研究稿黄,整合分析了開放染色質(zhì)與 TF motif, TF motif 與TF expression 以及順式調(diào)控元件與TF的相互作用
公布于 2018-05.22
第1周 2018-05.21-05.27