作者:堯小飛
審稿:童蒙
編輯:angelica
引言
在上一篇文章單細(xì)胞轉(zhuǎn)錄組(Single cell RNA)概述
,我們對(duì)單細(xì)胞轉(zhuǎn)錄組進(jìn)行了簡(jiǎn)單的介紹及其分析必備所需矩陣的獲得鸳玩。
此篇6000字干貨長(zhǎng)文在张,我們介紹常見(jiàn)的亞群分析內(nèi)容挑格。耐心看完收獲滿滿;或者收藏后慢慢看。
1.單細(xì)胞轉(zhuǎn)錄組亞群常見(jiàn)分析內(nèi)容
單細(xì)胞轉(zhuǎn)錄組亞群分析的內(nèi)容根據(jù)樣品數(shù)目多少懂版,可以分為單個(gè)樣品或者多個(gè)樣品萌狂。單個(gè)樣品主要可以進(jìn)行的分析內(nèi)容有:細(xì)胞亞群的鑒定档玻、亞群之間的差異以及發(fā)育軌跡分析。多個(gè)樣品分析內(nèi)容包括所有單個(gè)的分析內(nèi)容茫藏,并且在此基礎(chǔ)上還能進(jìn)行樣品的差異分析误趴。
這里樣品差異分析主要分兩個(gè)方面:
1.從宏觀上來(lái)說(shuō),不同亞群中不同樣品的細(xì)胞數(shù)目的差異务傲,不同亞群細(xì)胞具有不同的功能冤留,因此亞群的差異對(duì)于研究異質(zhì)性具有十分重要的作用。
2.從單個(gè)亞群來(lái)說(shuō)树灶,可以研究不同樣品之間的差異纤怒,比如同樣是上皮細(xì)胞,我們可以研究上皮細(xì)胞中不同樣品之間的差異天通,基因表達(dá)或者代謝通路的差異泊窘,這是從機(jī)理上來(lái)解釋生物學(xué)問(wèn)題。
一般使用Seurat工具進(jìn)行細(xì)胞亞群分析。 鏈接:https://github.com/satijalab/seurat
2.數(shù) 據(jù) 質(zhì) 控
2.1空載細(xì)胞烘豹、雙細(xì)胞瓜贾、雙細(xì)胞數(shù)據(jù)質(zhì)控
如上圖A左圖所示,為每個(gè)細(xì)胞的基因表達(dá)數(shù)目小提琴圖携悯。一般對(duì)于單細(xì)胞轉(zhuǎn)錄組來(lái)說(shuō)祭芦,如果細(xì)胞表達(dá)的基因數(shù)目過(guò)少,可能是空載細(xì)胞(在細(xì)胞分篩的時(shí)候憔鬼,溶液可能含有的游離mRNA)龟劲;如果細(xì)胞基因數(shù)目表達(dá)過(guò)高,可能是雙細(xì)胞(2個(gè)以上的細(xì)胞的基因表達(dá)數(shù)目一般就會(huì)較高)轴或。
圖A右圖為每個(gè)細(xì)胞中線粒體基因(線粒體基因的名稱一般為mt開(kāi)頭昌跌,不同物種大小寫(xiě)可能不一樣)的表達(dá)UMI占比,除非特別的樣品或者組織(比如卵組織)照雁,一般細(xì)胞的線粒體基因表達(dá)占比較低蚕愤。不同文獻(xiàn)會(huì)有不同的閾值,5-40%都有饺蚊,因此在做此數(shù)據(jù)質(zhì)控的時(shí)候需要根據(jù)自己的研究樣品設(shè)定一個(gè)合適的閾值萍诱,通常可以設(shè)為20-25%污呼。
圖B為雙細(xì)胞檢測(cè)方法介紹砂沛,如果細(xì)胞基因的表達(dá)數(shù)目過(guò)高,可能對(duì)結(jié)果具有較大的影響(比如有時(shí)過(guò)渡態(tài)細(xì)胞可能不是過(guò)渡態(tài)細(xì)胞曙求,而是雙細(xì)胞)碍庵,因此一般需要注意雙細(xì)胞數(shù)目。一般來(lái)說(shuō)悟狱,10xGenomics單細(xì)胞轉(zhuǎn)錄組平臺(tái)對(duì)雙細(xì)胞有一定的控制静浴,1000個(gè)細(xì)胞雙細(xì)胞率不超過(guò)0.9%,10000個(gè)細(xì)胞不超過(guò)7%挤渐。但是有時(shí)候由于實(shí)驗(yàn)因素苹享,可能會(huì)偏高,需要在分析的時(shí)候去掉雙細(xì)胞浴麻。
過(guò)濾雙細(xì)胞的方法有很多種得问,一種比較直接粗暴的方法就是把細(xì)胞基因表達(dá)數(shù)目超過(guò)一定閾值的細(xì)胞去掉(比如PBMC細(xì)胞,閾值為2500)软免,不過(guò)不同的樣品閾值不同宫纬;另外一種方式就是通過(guò)算法來(lái)去掉雙細(xì)胞,現(xiàn)在去掉雙細(xì)胞的工具有很多種膏萧,比如DoubletFinder(https://www.cell.com/cell-systems/fulltext/S2405-4712(19)30073-0)漓骚、scrublet(https://github.com/AllonKleinLab/scrublet)蝌衔、DoubletDecon(https://github.com/EDePasquale/DoubletDecon)、DoubletDetection(https://github.com/JonathanShor/DoubletDetection.git) 等等蝌蹂,python和R語(yǔ)言的工具都有噩斟,可以根據(jù)自己需要進(jìn)行工具選擇。
對(duì)于空載細(xì)胞分析孤个,一般cellranger流程已經(jīng)進(jìn)行處理過(guò)剃允。cellranger在進(jìn)行call cells的時(shí)候,會(huì)通過(guò)EmptyDrops工具根據(jù)其表達(dá)量與背景表達(dá)量的相似性進(jìn)行空載細(xì)胞的判斷齐鲤。鏈接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1662-y
當(dāng)然也會(huì)對(duì)基因進(jìn)行質(zhì)控斥废,一般會(huì)過(guò)濾掉基因表達(dá)細(xì)胞數(shù)目過(guò)低的基因,比如一般要求至少在3多個(gè)或者5個(gè)細(xì)胞表達(dá)的基因佳遂。
2.2特定細(xì)胞質(zhì)控
特定細(xì)胞的質(zhì)控营袜,這個(gè)一般需要通過(guò)特定的樣品進(jìn)行分析撒顿,比如PBMC細(xì)胞中不能含有血紅蛋白基因高表達(dá)的細(xì)胞丑罪,血紅蛋白基因高表達(dá)細(xì)胞一般是紅細(xì)胞,但是紅細(xì)胞對(duì)于我們的研究一般來(lái)說(shuō)沒(méi)有什么意義凤壁,因此一般需要過(guò)濾掉此類細(xì)胞吩屹,這個(gè)閾值不同的樣品設(shè)定的不一樣,比如可以設(shè)定閾值為5%拧抖。
其他特定細(xì)胞的質(zhì)控煤搜,比如我們經(jīng)過(guò)流式篩選的是T細(xì)胞,結(jié)果出現(xiàn)高表達(dá)B細(xì)胞唧席、巨噬細(xì)胞等其他細(xì)胞類型的marker基因擦盾,因此需要去掉此類細(xì)胞,一般此類細(xì)胞聚類都分離得比較開(kāi)淌哟,與其他細(xì)胞不一樣迹卢,比如下圖所示。
2.3降維可變基因和PCA數(shù)目選擇
如上圖所示徒仓,一般會(huì)選擇變化度較大的基因進(jìn)行后續(xù)降維聚類分析腐碱。一般選擇top1000或者2000基因進(jìn)行PCA降維。然后聚類時(shí)掉弛,一般是挑選特定的PCA數(shù)目進(jìn)行聚類症见,比如圖B所示的碎石圖,一般會(huì)選擇在拐點(diǎn)位置的PCA數(shù)目進(jìn)行后續(xù)分析殃饿。
2.4細(xì)胞周期質(zhì)控
上述圖A為沒(méi)有進(jìn)行細(xì)胞周期變異的排除谋作,圖B為進(jìn)行細(xì)胞周期變異的排除,圖C為S.Score-G2M.Score進(jìn)行變異的排除的結(jié)果乎芳。目前主要是人的物種有細(xì)胞周期基因瓷们,如果想對(duì)其他物種進(jìn)行細(xì)胞周期分析业栅,可以根據(jù)與人的同源基因比對(duì)后進(jìn)行。
另外需要注意的是谬晕,不是所有的樣品都適合進(jìn)行細(xì)胞周期分析碘裕,如果是干細(xì)胞分化研究,這樣的話就可能有點(diǎn)不合適攒钳,使用兩者之間的差異進(jìn)行分析會(huì)更合適一些帮孔。具體情況需要根據(jù)樣品進(jìn)行分析(這樣會(huì)將細(xì)胞周期細(xì)胞與非周期細(xì)胞分隔開(kāi))。
3.細(xì) 胞 亞 群 差 異
在進(jìn)行所有質(zhì)控后不撑,進(jìn)行降維聚類文兢,得到如上的聚類結(jié)果圖。現(xiàn)在降維可視化的方法主要有TSNE和UMAP焕檬。
一般來(lái)說(shuō)姆坚,TSNE為局部最優(yōu)的結(jié)果,邊界較為清晰实愚;UMAP可視化結(jié)果一般為全局最優(yōu)兼呵,但是邊界沒(méi)有TSNE清晰。但是聚類的結(jié)果與可視化的方法沒(méi)有任何關(guān)系腊敲,比如上圖击喂,雖然圖A和圖B圖形不一樣,但是其聚類結(jié)果完全一致碰辅。
4.亞 群 細(xì) 分 策 略
一般單細(xì)胞轉(zhuǎn)錄組很少能夠一次性得到符合預(yù)期的結(jié)果懂昂,需要對(duì)結(jié)果需要調(diào)整,比如需要對(duì)亞群數(shù)目進(jìn)行調(diào)整没宾。
如果使用Seurat(https://satijalab.org/seurat/)工具的話凌彬,可以通過(guò)調(diào)整FindClusters函數(shù)的resolution參數(shù)進(jìn)行調(diào)整,一般可以設(shè)0.1-1之間循衰,這個(gè)值越高吉懊,得到亞群數(shù)目越多救斑,但是細(xì)胞亞群數(shù)目不能太多地技,不然后續(xù)分析比較耗費(fèi)精力朗鸠。
另外一種需要進(jìn)一步或者調(diào)整結(jié)果的是,對(duì)感興趣的細(xì)胞亞群進(jìn)行亞群細(xì)分顽素,可以把感興趣的一個(gè)亞群或者多個(gè)亞群提取出來(lái)咽弦,然后再進(jìn)行亞群細(xì)分。
亞群細(xì)分一般有兩種方式:第一種胁出,通過(guò)分辨率型型,可以使亞群數(shù)目增多。比如下圖的1亞群全蝶,可以看到1亞群和1亞群的細(xì)分的圖形一致闹蒜;第二種寺枉,將此亞群提取出來(lái),然后再整體的按照之前分析的pipeline進(jìn)行重新分析绷落。因此其亞群細(xì)分的結(jié)果圖形會(huì)發(fā)生變化姥闪,比如下圖的7亞群細(xì)分。
5.亞 群 功 能 分 析
一般進(jìn)行簡(jiǎn)單細(xì)胞亞群分析后砌烁,會(huì)再對(duì)亞群進(jìn)行差異分析筐喳。進(jìn)行差異分析時(shí),一般是選擇該亞群與除了該亞群以外所有的亞群進(jìn)行分析函喉,一般閾值有pct(亞群中某個(gè)基因表達(dá)的占比)和差異倍數(shù)(平均表達(dá)量)避归,對(duì)于Seurat工具來(lái)說(shuō),差異倍數(shù)一般設(shè)為0.25管呵,pct閾值一般是該亞群和該亞群以外所有亞群至少一個(gè)的pct值大于0.1梳毙。通過(guò)此方法得到的差異基因,也認(rèn)為是marker基因捐下,即每個(gè)亞群特異的基因账锹。
根據(jù)上述方法得到的差異基因,進(jìn)行功能分析蔑担,了解每個(gè)亞群特異的功能牌废,一般會(huì)進(jìn)行GO和KEGG分析咽白,然后通過(guò)氣泡圖展示差異啤握,如下圖所示:
6.細(xì) 胞 亞 群 鑒 定
根據(jù)上述得到的marker基因,對(duì)細(xì)胞亞群進(jìn)行鑒定晶框,這也是單細(xì)胞轉(zhuǎn)錄組分析最重要的一步排抬,也是最關(guān)鍵的一步,通常需要花費(fèi)大量的精力進(jìn)行細(xì)胞亞群鑒定授段。
通常細(xì)胞亞群鑒定的方式有如下四種:傳統(tǒng)經(jīng)典marker基因蹲蒲、自動(dòng)化鑒定工具、其他單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)映射侵贵、與bulk RNA相關(guān)性分析届搁。
6.1傳統(tǒng)經(jīng)典marker基因
根據(jù)已知的細(xì)胞類型的marker基因進(jìn)行細(xì)胞亞群鑒定。如上圖右上角小提琴圖窍育,可以明顯看出PF4基因在亞群7特異性表達(dá)卡睦,因此可以根據(jù)此基因?yàn)槟承┘?xì)胞類型marker基因進(jìn)行細(xì)胞亞群鑒定。
一般亞群鑒定不是單獨(dú)一個(gè)基因漱抓,可能需要多個(gè)基因表锻。說(shuō)到這里,我們需要知道傳統(tǒng)經(jīng)典的marker基因乞娄,這個(gè)表格從哪兒來(lái)呢瞬逊?
一般有如下兩個(gè)常用數(shù)據(jù)庫(kù):
CellMarker:http://biocc.hrbmu.edu.cn/CellMarker/
panglaodb:https://panglaodb.se/index.html
不過(guò)這兩個(gè)數(shù)據(jù)庫(kù)都只是提供了人和小鼠相關(guān)的數(shù)據(jù)显歧,沒(méi)有其他物種的,因此其他物種最好通過(guò)查詢相應(yīng)的文獻(xiàn)來(lái)確定确镊。
6.2自動(dòng)化鑒定工具
目前單細(xì)胞亞群鑒定的自動(dòng)化工具有很多種士骤,至少有20-30種,這些工具主要有兩種蕾域,一種是自動(dòng)化鑒定敦间,另外一種是半監(jiān)督的方式。
自動(dòng)化鑒定比較常見(jiàn)的singleR束铭,內(nèi)置了人和小鼠的數(shù)據(jù)廓块,其基本原理是通過(guò)計(jì)算單細(xì)胞與內(nèi)置數(shù)據(jù)庫(kù)的相關(guān)性來(lái)判斷細(xì)胞類型,也可以自己建數(shù)據(jù)庫(kù)契沫。地址為:https://github.com/dviraran/SingleR
優(yōu)點(diǎn)是不用自己提供細(xì)胞類型以及相應(yīng)的marker基因带猴,但是其缺點(diǎn)是只能鑒定出數(shù)據(jù)庫(kù)已有的細(xì)胞類型以及不能鑒定特別細(xì)的細(xì)胞亞群,特別細(xì)的細(xì)胞亞群比如CD4+T 細(xì)胞亞群再細(xì)分懈万,就沒(méi)法完成了拴清。
另外一種是半監(jiān)督的方式,需要自己提供細(xì)胞類型的marker基因会通,也就是只能鑒定自己提供的細(xì)胞類型口予,一是限制了細(xì)胞類型,另一方面則是可以鑒定任意感興趣的細(xì)胞類型涕侈,不過(guò)這種方式需要老師具有較深厚的生物學(xué)背景沪停。
比較常用的軟件有cellassign和Garnett,其中cellassign只要提供細(xì)胞類型以及對(duì)應(yīng)的基因裳涛,軟件根據(jù)TensorFlow機(jī)器學(xué)習(xí)的方法木张,對(duì)每個(gè)細(xì)胞進(jìn)行打分。Garnett是擬時(shí)間分析工具-monocle工具編寫(xiě)的團(tuán)隊(duì)開(kāi)發(fā)的一種細(xì)胞簡(jiǎn)單快速注釋細(xì)胞類型的工具端三。它不僅僅提供了根據(jù)基因鑒定細(xì)胞亞群舷礼,還可以通過(guò)設(shè)定基因表達(dá)量閾值、或者不含某個(gè)基因來(lái)篩選郊闯,而且官方提供了一定數(shù)目的細(xì)胞類型的marker基因list妻献。
cellassign地址:https://irrationone.github.io/cellassign/index.html
Garnett地址:https://cole-trapnell-lab.github.io/garnett/
6.3不同單細(xì)胞數(shù)據(jù)映射
其實(shí)現(xiàn)在很多人都會(huì)問(wèn),現(xiàn)在已經(jīng)有那么多單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)团赁,為什么不可以利用已知的單細(xì)胞數(shù)據(jù)來(lái)鑒定未知單細(xì)胞數(shù)據(jù)育拨?
其實(shí)是可以的,而且這種操作的方法和工具還挺多的然痊,比較常用的是Seurat工具中有個(gè)TransferData 函數(shù)至朗,可以將別的數(shù)據(jù)標(biāo)簽映射到未知的數(shù)據(jù),從而鑒定細(xì)胞類型剧浸,測(cè)試數(shù)據(jù)準(zhǔn)確性可達(dá)90%以上锹引。地址:https://satijalab.org/seurat/v3.1/integration.html
6.4與Bulk RNA數(shù)據(jù)進(jìn)行相似性分析
另外一種比較常見(jiàn)細(xì)胞亞群鑒定方式就是矗钟,用單細(xì)胞屬于相應(yīng)細(xì)胞類型的細(xì)胞系測(cè)序獲得的Bulk RNA數(shù)據(jù)進(jìn)行相關(guān)性分析,得到相似性熱圖嫌变,判斷細(xì)胞類型吨艇,結(jié)果如下圖。
此方法是比較耗費(fèi)精力腾啥,需要收集相應(yīng)細(xì)胞類型的Bulk RNA數(shù)據(jù)东涡,另外單細(xì)胞數(shù)據(jù)表達(dá)的模式可能與Bulk RNA數(shù)據(jù)不太一致,因此此方法一般用于數(shù)據(jù)驗(yàn)證倘待,不作為鑒定結(jié)果疮跑。
最后說(shuō)一句,其實(shí)也有一些使用marker基因進(jìn)行細(xì)胞亞群鑒定的小工具凸舵。比如可以使用Y叔的Clusterprofle工具祖娘,通過(guò)對(duì)輸入的marker基因進(jìn)行富集,得到可能細(xì)胞亞群啊奄,不過(guò)有個(gè)缺點(diǎn)就是渐苏,對(duì)于一些通過(guò)流式得到的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),比如某個(gè)細(xì)胞只有CD4+和CD8+細(xì)胞菇夸,可能CD4+和CD8+基因不是marker基因琼富,不在marker基因list中,因此鑒定會(huì)有些問(wèn)題庄新。
7.單細(xì)胞轉(zhuǎn)錄組樣品差異分析
10xGenomics單細(xì)胞轉(zhuǎn)錄組一次可獲取10000個(gè)細(xì)胞鞠眉。在研究的時(shí)候,不能一個(gè)細(xì)胞一個(gè)細(xì)胞研究摄咆,一般通過(guò)降維聚類凡蚜,將表達(dá)模式相同的細(xì)胞聚類在一起人断,即得到細(xì)胞亞群吭从,隨后的研究是基于細(xì)胞亞群進(jìn)行。
研究不同樣品恶迈、不同處理?xiàng)l件涩金、不同組織樣品的時(shí)候,一般是在同一個(gè)亞群之下進(jìn)行的研究暇仲,畢竟不同類型的細(xì)胞其表達(dá)模式肯定不一樣步做,這個(gè)可比性不太強(qiáng)。比如在使用某種藥物處理后奈附,想看看CD4+ naive T細(xì)胞有什么變化全度,然后挑取CD4+ naive T細(xì)胞亞群,直接比較兩個(gè)樣品的細(xì)胞基因表達(dá)差異斥滤,然后對(duì)此基因進(jìn)行功能注釋将鸵,了解哪些關(guān)鍵基因發(fā)生變化勉盅,代謝通路發(fā)生了變化。
由于10xGenomics單細(xì)胞轉(zhuǎn)錄組的基因表達(dá)較smart-seq2的數(shù)據(jù)較低顶掉,因此一般進(jìn)行差異分析的時(shí)候草娜,其閾值不能直接按照smart-seq2的閾值設(shè)置,seurat一般設(shè)為差異倍數(shù)的log值為0.25痒筒。
我們也可以根據(jù)每個(gè)樣品在某個(gè)亞群中所有細(xì)胞基因的平均表達(dá)量作散點(diǎn)圖宰闰,這樣能更直觀地展示差異基因,比如下圖展示了top10基因簿透,一般越靠近y軸的基因移袍,就是STIM高表達(dá),越靠近x軸老充,就是CTRL高表達(dá)咐容。下圖使用了不同的差異基因展示方式。
8.基 因 集 富 集 分 析
除了對(duì)常規(guī)的差異基因或者marker基因的功能分析以外蚂维,還有一種就是對(duì)某個(gè)基因集進(jìn)行富集分析或者說(shuō)打分戳粒。這種分析方式不需要在不同樣品之間進(jìn)行比較,關(guān)注點(diǎn)是某個(gè)基因集在每個(gè)細(xì)胞虫啥、每個(gè)細(xì)胞亞群中的富集程度蔚约,其中這樣分析的內(nèi)容可就多了。
基因集可以根據(jù)需要進(jìn)行設(shè)置涂籽,比如關(guān)注T細(xì)胞激活的話苹祟,給定T細(xì)胞激活的基因集,就可以看到每個(gè)細(xì)胞的T細(xì)胞激活程度评雌∈鞣悖基因集分析比較常用的工具是GSVA(Gene Set Variation Analysis),鏈接如下:http://www.bioconductor.org/packages/release/bioc/html/GSVA.html
這里需要注意的是該工具盡量不要使用counts表達(dá)矩陣作為輸入數(shù)據(jù)景东,如果實(shí)在需要用counts表達(dá)矩陣作為輸入文件的話砂轻,需要修改GSVA的參數(shù)kcdf,設(shè)為Poisson斤吐,其默認(rèn)為Gaussian搔涝。但是使用Poisson的時(shí)候,其耗時(shí)巨大和措,因此不建議使用counts表達(dá)矩陣庄呈。
一般建議使用連續(xù)性值,比如log-CPMs, log-RPKMs or log-TPMs派阱,這樣分析速度快很多诬留,一般兩三萬(wàn)細(xì)胞的話,30個(gè)基因集以內(nèi)的,24小時(shí)內(nèi)就可以完成文兑。
至于基因集的設(shè)置傀广,一般可以使用GO Term、KEGG代謝通路彩届、reactome代謝通路伪冰、或者GSEA官方基因集、自己提供的基因集都可以樟蠕,下圖為GSVA結(jié)果展示贮聂。
9.單細(xì)胞轉(zhuǎn)錄組發(fā)育軌跡分析
發(fā)育軌跡分析即擬時(shí)間分析,就是根據(jù)細(xì)胞中基因的表達(dá)量寨辩,基于特定基因?qū)?xì)胞進(jìn)行排序的一個(gè)過(guò)程吓懈,其結(jié)果主要反映細(xì)胞發(fā)育的先后。
一般軟件得到的結(jié)果是沒(méi)法確定發(fā)育起始點(diǎn)靡狞,需要根據(jù)某些基因來(lái)判斷發(fā)育起始點(diǎn)耻警,這里特定基因可以是軟件自動(dòng)計(jì)算差異的基因,也可以是已知的跟發(fā)育相關(guān)的基因甸怕。其中最常用的發(fā)育軌跡的工具是monocle(http://cole-trapnell-lab.github.io/monocle-release/)
當(dāng)然發(fā)育軌跡分析的工具有很多甘穿,目前能做此類分析結(jié)果的工具至少有60+以上,比如dyno (https://github.com/dynverse/dynmethods)工具搜集了60+梢杭,做了一個(gè)所有擬時(shí)間分析的集合温兼,包括常用的monocle(http://cole-trapnell-lab.github.io/monocle-release/)、PAGA(https://github.com/theislab/paga)武契、pCreode(https://github.com/KenLauLab/pCreode)等等募判,不過(guò)此軟件是基于docker,因此需要系統(tǒng)有root權(quán)限咒唆。
不同的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)具有不同的特征届垫,可能某個(gè)軟件并不通用的。因此dyno工具通過(guò)其前期的表達(dá)特征全释,提供該數(shù)據(jù)對(duì)所有軟件的最優(yōu)適配的方案装处,可以選擇最優(yōu)的方案。
不過(guò)此工具也有局限性恨溜,比如工具不全符衔、工具的版本更新不及時(shí)(monocle現(xiàn)在為版本2)、某些功能的缺失糟袁、與其他工具的兼容性有待提升等等。因此沒(méi)有任何萬(wàn)能的工具躺盛,只能根據(jù)需要進(jìn)行挑選工具项戴。
這一篇中,介紹了常見(jiàn)的亞群分析的內(nèi)容和工具槽惫,下一篇我們會(huì)介紹詳細(xì)的單細(xì)胞轉(zhuǎn)錄組其他高級(jí)分析過(guò)程和原理周叮,請(qǐng)大家繼續(xù)關(guān)注辩撑。
參考文獻(xiàn)
1.Giovanni Iacono, Ramon Massoni-Badosa, Holger Heyn. Single-cell transcriptomics unveils gene regulatory network plasticity[J]. Genome biology, 2019, 20(1).
2.Gioele L M , Ruslan S , Amit Z , et al. RNA velocity of single cells[J]. Nature, 2018.
3.Park J , Shrestha R , Qiu C , et al. Single-cell transcriptomics of the mouse kidney reveals potential cellular targets of kidney disease[J]. Science, 2018:eaar2131.
4.Zhang X, Lan Y, Xu J, et al. CellMarker: a manually curated resource of cell markers in human and mouse[J]. Nucleic Acids Research, 2019.
5.Aran D, Looney A P, Liu L, et al. Reference-based analysis of lung single-cell sequencing reveals a transitional profibrotic macrophage[J]. Nature Immunology, 2019, 20(2): 163-172.
6.Aibar S , González-Blas, Carmen Bravo, Moerman T , et al. SCENIC: single-cell regulatory network inference and clustering[J]. Nature Methods, 2017.
7.Wouter, Saelens, Robrecht, et al. A comparison of single-cell trajectory inference methods[J]. Nature Biotechnology, 2019.
8.F, Alexander, Wolf, et al. PAGA: graph abstraction reconciles clustering with trajectory inference through a topology preserving map of single cells.[J]. Genome biology, 2019.
9.Diether L , Els W , Bram B , et al. Phenotype molding of stromal cells in the lung tumor microenvironment[J]. Nature Medicine, 2018.
10.Zheng C , Zheng L , Yoo J K , et al. Landscape of Infiltrating T Cells in Liver Cancer Revealed by Single-Cell Sequencing[J]. Cell, 2017, 169(7):1342-1356.e16.
該文來(lái)源于“生信阿拉丁”,關(guān)注公眾號(hào)仿耽,第一時(shí)間查收“新款”生信學(xué)習(xí)干貨合冀。