Seurat包介紹康吵,它是用于單細(xì)胞轉(zhuǎn)錄組分析
先用相關(guān)函數(shù)讀取數(shù)據(jù),包里的Read10X()
1.預(yù)處理:性狀標(biāo)準(zhǔn)化
pbmc<-ScaleData(pbmc)
2.找出:關(guān)鍵性狀(高變基因)差異大的基因就是高變基因
pbmc<-FindVariableFeatures(pbmc,selection.method="vst",nfeatures=2000)設(shè)定2000個(gè)高變基因
plot<-VariableFeaturePlot(pbmc)
3.降維(因?yàn)?000個(gè)高變基因還是較多的,需要降維,減少高變基因斟湃,例如降低到10個(gè)高變基因代替這2000個(gè)高變基因洒扎。
pbmc<-RunPCA(pbmc,features=VariableFeatures(object=pbmc))
Dimplot(pbmc,reduction="pca") PC_1為第一主分析辑甜,PC_2為第二,重要程度上1>2袍冷,因?yàn)閜c_1解釋的權(quán)重更大磷醋。
pca:主成分分析,是一種降維技巧胡诗,將大量的相關(guān)變量轉(zhuǎn)化為很少的無(wú)關(guān)變量邓线,例如一群細(xì)胞,通過(guò)它的形狀顏色等進(jìn)行分為幾大類(lèi)煌恢。有兩個(gè)細(xì)胞骇陈,很多個(gè)基因,把每個(gè)基因的測(cè)量結(jié)果繪制在圖上瑰抵,基因1在細(xì)胞1高度轉(zhuǎn)錄你雌,在細(xì)胞2低轉(zhuǎn)錄·····,這就意味著這是兩類(lèi)不同的細(xì)胞二汛,因?yàn)樗麄冊(cè)谑褂貌煌幕蛐稣浮I蠄D為主成分分析圖pca,pca圖將細(xì)胞之間的相關(guān)性(或不相關(guān))轉(zhuǎn)化為2-D圖肴颊,高度相關(guān)的聚集在一起氓栈,
Elbowplot(pbmc)#通過(guò)這個(gè)圖,找到拐點(diǎn)婿着,確定pca值為10授瘦,確定維度,分為10類(lèi)
4.進(jìn)行聚類(lèi)
數(shù)據(jù)進(jìn)行降維后祟身,在進(jìn)行聚類(lèi)分群
UMAP聚類(lèi)
pbmc<-RunUMAP(pbmc,dims=1:10)
Dimplot(pbmc,reduction="umap")可視化
tSNE聚類(lèi)
pbmc<-RunTSNE(pbmc,dims=1:10)
DimPlot(pbmc,reduction="tsne")可視化