作者甸饱,Evil Genius
最近見到了很多研究者李皇,真的是不把單細(xì)胞軌跡分析當(dāng)回事门烂,拿到樣本不定義直接跑monocle,這能對(duì)么送挑?我看了都著急,基本理論要多多學(xué)習(xí)啊~~~暖眼,網(wǎng)上那么多教程惕耕,有甄別的看,不要盲目跑代碼诫肠。
單細(xì)胞個(gè)性化分析之軌跡分析篇
理論知識(shí)不是本篇重點(diǎn)司澎,簡(jiǎn)單介紹一下
軌跡分析主要基于以下3個(gè)步驟:
(1)基因篩選:尋找以“擬時(shí)”(即不只是嘈雜)方式變化的基因,并利用這些基因來構(gòu)造數(shù)據(jù)栋豫。
(2)降低維度:一旦選擇了用于細(xì)胞排序的基因挤安,就會(huì)對(duì)數(shù)據(jù)進(jìn)行降維處理。
(3)pseudotime對(duì)細(xì)胞排序:通過將表達(dá)數(shù)據(jù)投影到較低維空間丧鸯,構(gòu)建細(xì)胞間的分化軌跡漱受。
基因篩選
構(gòu)建的軌跡分析首先是要選擇用于構(gòu)建軌跡的基因,當(dāng)然骡送,選擇軌跡分析時(shí)用到的基因有很多方法昂羡。
(1)離散度高的基因(monocle自帶的方法,默認(rèn)前1000):缺點(diǎn)是a摔踱、基因是否與發(fā)育相關(guān)不清楚虐先;b、不同細(xì)胞類型的發(fā)育選取的基因數(shù)量不可能一致派敷;c蛹批、基因斷層(即基因并不是連續(xù)變化)撰洗;d、軟件并不能依據(jù)軌跡基因來判斷細(xì)胞是否具有多種分化路徑腐芍。
(2)Seurat[2]本身挑選高變基因的三種方法(vst差导、mean.var.plot、dispersion):因?yàn)镾eurat降維聚類的關(guān)系猪勇,Seurat選擇的高變基因也可以用于做軌跡分析设褐,但缺點(diǎn)也很明顯a、基因是否與發(fā)育相關(guān)不清楚泣刹;b助析、不同細(xì)胞類型的發(fā)育選取的基因數(shù)量不可能一致;c椅您、基因斷層外冀;d、Seurat本身挑選的高變基因基于樣本整體掀泳,沒有分化關(guān)系的也納入了分析雪隧。
(3)如果背景很強(qiáng),最好的解決方式是根據(jù)生物學(xué)背景選取發(fā)育的相關(guān)基因(例如采取多樣本员舵、多時(shí)間點(diǎn)的策略推斷發(fā)育基因脑沿,a、對(duì)比不同時(shí)間相同細(xì)胞類型的基因變化關(guān)系固灵。b、挑選表征分化關(guān)系的基因進(jìn)行軌跡分析)劫流,缺點(diǎn)很明顯巫玻,難度特別大。
(4)尋找細(xì)胞類型之間具有連續(xù)變化的基因祠汇,理論上這是最優(yōu)的選擇仍秤。
降低維度
降維方法除了在基礎(chǔ)分析篇提到的線性降維PCA與非線性降維TSNE、UMAP之外可很,針對(duì)軌跡分析會(huì)有獨(dú)特的降維方法诗力。來了解一下軌跡分析軟件用到的主流降維方式。