SCTransform
SCTransform一個(gè)函數(shù)包括NormalizeData嗦随,ScaleData,FindVariable三個(gè)函數(shù)的功能,因此使用SCTransform的pipeline如下
#讀取數(shù)據(jù)敬尺,計(jì)算線粒體基因占比
scRNA_counts = Read10X("C:/Users/86269/Desktop/shun.C/single_cell/BC21")
scRNA = CreateSeuratObject(scRNA_counts,project = "sample_21",
min.cells = 3, min.features = 300)
min.cells = 3, min.features = 300)
scRNA = PercentageFeatureSet(scRNA,pattern="^MT-",col.name="percent.mt
#使用SCTransform進(jìn)行歸一化
scRNA =SCTransform(scRNA,vars.to.regress = "percent.mt",verbose = FALSE)
#基于SCTransform繼續(xù)進(jìn)行降維聚類
#PCA降維
scRNA <- RunPCA(scRNA,verbose = FALSE)
#umap聚類
scRNA <- RunUMAP(scRNA,dims=1:30,verbose=FALSE)
#tsne聚類
scRNA <- FindNeighbors(scRNA,dims=1:30,verbose=FALSE)
scRNA <- FindClusters(scRNA,verbose=FALSE)
#可視化
DimPlot(scRNA,label=TRUE)
Seurat對(duì)象的結(jié)構(gòu)
Seurat對(duì)象.png
Seurat對(duì)象最重要的成分是assays與meta.data
- assays主要保存了所有細(xì)胞的UMI矩陣
- meta.data
![meta.data.png](https://upl
oad-images.jianshu.io/upload_images/28382212-d431117716e36e9d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) - orig.ident:儲(chǔ)存細(xì)胞的樣本來(lái)源枚尼,也可以自行修改
- ncount_RNA:每個(gè)細(xì)胞的UMI數(shù)量
- nFeature_RNA:每個(gè)細(xì)胞檢測(cè)到的基因數(shù)
UMI與barcodes
barcode與UMI.png
圖中綠色片段是barcode,右邊緊接著就是UMI砂吞。每一種barcode代表一個(gè)細(xì)胞署恍,每一種UMI代表一個(gè)count
marker基因的尋找
1.FindMarkers:用于尋找兩個(gè)不同組別的細(xì)胞的marker基因
2.FindAllMarkers:用于尋找一個(gè)細(xì)胞集中每個(gè)cluster的marker基因
3.FindConservedMarkers:用于尋找在兩個(gè)不同組別中的保守的marker基因(即這兩個(gè)組別中表達(dá)相似,但與別的組別有明顯差異的marker基因)
數(shù)據(jù)標(biāo)準(zhǔn)化
數(shù)據(jù)標(biāo)準(zhǔn)化是指將數(shù)據(jù)按照比例放縮蜻直,使其落入特定區(qū)間
數(shù)據(jù)歸一化時(shí)最簡(jiǎn)單的數(shù)據(jù)標(biāo)準(zhǔn)化方法盯质,其目的是將數(shù)據(jù)變?yōu)椋?,1)之間的小數(shù)并將有量綱的數(shù)據(jù)轉(zhuǎn)化為無(wú)量綱的純數(shù)量