結(jié)合單細(xì)胞測序和功能篩選揭示lncRNA H19對胚胎造血干細(xì)胞發(fā)育的關(guān)鍵作用
日期:2019年1月19日——2019-Week3
分類:「思路」
題目:Combined Single-Cell Profiling of lncRNAs and Functional Screening Reveals that H19 Is Pivotal for Embryonic Hematopoietic Stem Cell Development
DOI: https://doi.org/10.1016/j.stem.2018.11.023
雜志: Cell Stem Cell可柿,F(xiàn)ebruary 7, 2019
關(guān)鍵詞: single cell lncRNA, H19, HSC
摘要
這篇文章通過對該實驗室16年發(fā)表的造血干細(xì)胞單細(xì)胞(HSC)測序數(shù)據(jù)的進(jìn)一步挖掘,篩選出了6個影響造血作用的lncRNA烟阐,然后驗證了其中的一個lncRNA H19的功能琳猫,發(fā)現(xiàn)H19 通過使HSC的轉(zhuǎn)錄因子(Runx1晚胡, Spi1)的啟動子甲基化的機(jī)制在內(nèi)皮細(xì)胞向HSC轉(zhuǎn)化過程中發(fā)揮著重要作用寻拂。
文章思路如下:
構(gòu)建造血干細(xì)胞發(fā)育的單細(xì)胞lncRNA整體圖譜
首先是從單細(xì)胞RNA-seq數(shù)據(jù)篩選lncRNA桌粉,統(tǒng)計已知的未知的lncRNA以及每個發(fā)育時期的lncRNA數(shù)量,然后分析lncRNA與鄰近基因的共調(diào)控關(guān)系鳞青,lncRNA-mRNA相關(guān)性分析和SOM(self-organizing maps)表達(dá)異質(zhì)性分析霸饲。通過生物信息學(xué)和功能篩選鑒定到6個影響造血作用的lncRNA
根據(jù)差異lncRNA和lncRNA的功能特征,篩選從EC-T1 pre-HSC發(fā)育過程中上調(diào)的lncRNA臂拓,屬于pre-HSC特征的lncRNA厚脉,和在物種中保守性強的lncRNA,最后篩選到10個lncRNA:AI662270, Gm28875, 4930538E20Rik, Gm28177, RP23-95l4.3, Gm15135, 4933439C10Rik, 1700113A116Rik, Gm17275, H19胶惰。然后結(jié)合敲低實驗傻工,發(fā)現(xiàn)10個lncRNA中有6個lncRNA有表型( H19, AI66270, 4933439C10Rik, Gm15135, Gm17275, 1700113A16Rik)。其中H19敲低后孵滞,表型最顯著中捆。lncRNA H19的缺失導(dǎo)致AGM區(qū)內(nèi)皮細(xì)胞生成HSC失敗
實驗驗證H19的缺失導(dǎo)致AGM區(qū)內(nèi)皮細(xì)胞生成HSC失敗-
H19缺乏導(dǎo)致pre-HSC中的Runx1和Spi1啟動子高甲基化
進(jìn)一步驗證H19的發(fā)揮作用的機(jī)制
1. lncRNA單細(xì)胞水平整體變化以及與mRNA的相關(guān)性分析
128個單細(xì)胞lncRNA圖譜,6個細(xì)胞類型坊饶,ployA+捕獲轉(zhuǎn)錄本泄伪,共鑒定到7312個lncRNA,其中6911個lncRNA是已知的有注釋的匿级,401個lncRNA是未未知的蟋滴,13786個蛋白編碼基因。每個細(xì)胞中的lncRNA基因的平均數(shù)量明顯少于mRNA基因痘绎,而lncRNA轉(zhuǎn)錄本在T2譜系最高津函,mRNA轉(zhuǎn)錄本在T1時期最高。
然后對lncRNA和其臨近的基因做相關(guān)性分析孤页,定義>5kb的為trans尔苦,< 5kb的cis作用,并根據(jù)lncRNA和mRNA的作用方式分為6種類型,最后對這幾種類型的lncRNA從進(jìn)化的角度在不同物種間做了保守性分析蕉堰。
2. HSC發(fā)育過程中l(wèi)ncRNA的差異變化和功能特征注釋
分別對lncRNA進(jìn)行差異分析和PCA分析凌净,可以看出lncRNA在發(fā)育的不同時期具有異質(zhì)性,T1屋讶,T2和BM HSC中的lncRNA共有12個overlap冰寻,F(xiàn)圖用circos展示了lncRNA與其臨近的5個基因的相互關(guān)系。
3. 體外篩選調(diào)控造血作用的lncRNA
首先篩選從EC-T1 pre-HSC發(fā)育過程中上調(diào)的lncRNA皿渗,屬于pre-HSC特征的lncRNA斩芭,和在物種中保守性強的lncRNA,最后篩選到10個lncRNA:AI662270, Gm28875, 4930538E20Rik, Gm28177, RP23-95l4.3, Gm15135, 4933439C10Rik, 1700113A116Rik, Gm17275, H19乐疆。然后結(jié)合敲低實驗划乖,發(fā)現(xiàn)10個lncRNA中有6個lncRNA有表型( H19, AI66270, 4933439C10Rik, Gm15135, Gm17275, 1700113A16Rik)。其中H19敲低后挤土,表型最顯著琴庵。
4. lncRNA H19的功能研究
lncRNA H19缺失導(dǎo)致AGM區(qū)內(nèi)皮細(xì)胞生成HSC失敗
5. H19發(fā)揮作用的機(jī)制
H19缺乏導(dǎo)致pre-HSC中的Runx1和Spi1啟動子高甲基化
方法
單細(xì)胞數(shù)據(jù)的處理分析方法:
SMRT-seq測序,TopHat比對仰美,HT-seq定量迷殿,scde package做的差異分析,分別對所有基因和top500基因做PCA分析咖杂。lncRNA和臨近編碼基因的表達(dá)關(guān)聯(lián)用的是Circle tools(http://www.genome.org/cgi/doi/10.1101/gr.092759.109)庆寺。擬時間軌跡分析用的是Monocle,T-SNE用的是tsne package, TF網(wǎng)絡(luò)分析用的是Fantom5 mouse TFs, 網(wǎng)絡(luò)圖繪制用的是Cytoscape诉字。
相關(guān)性分析:
pairwise Pearson相關(guān)性分析每個lncRNA和其臨近的5個基因懦尝。GO注釋用的 PANTHER (http://www.pantherdb.org/).
Self-Organizing Maps
SOM是人工神經(jīng)網(wǎng)絡(luò)的一種類型,基于無監(jiān)督學(xué)習(xí)訓(xùn)練模型生成輸入的訓(xùn)練樣本空間的低維(通常是二維)離散表示壤圃。這里用于將具有相同表達(dá)模式的lncRNA和mRNA聚類陵霉,然后可以通過在相同cluster的編碼基因的功能預(yù)測lncRNA的功能。
未知的lncRNA的從頭組裝和注釋
cufflinks組裝埃唯,CPAT和PhlyoCSF軟件對編碼潛能進(jìn)行評估撩匕。
數(shù)據(jù)集:
GEO: GSE67120
GEO: GSE108653.
這篇文章篩選候選lncRNA的方法值得學(xué)習(xí),如通過lncRNA-mRNA相關(guān)性分析構(gòu)建lncRNA-mRNA pairs墨叛,lncRNA的位置分析找出臨近基因和trans作用的基因,以及結(jié)合深度學(xué)習(xí)的方法將具有相同表達(dá)模式lncRNA和mRNA聚類到一個cluster模蜡,然后由mRNA的功能預(yù)測lncRNA的功能漠趁,并結(jié)合差異lncRNA和功能試驗篩選不斷縮小候選lncRNA,最后選擇一個與表型相關(guān)最強的一個lncRNA進(jìn)行功能和機(jī)制的研究忍疾。