通過對Seurat 包的裝飾,提高 scRNA-seq 數(shù)據(jù)的處理和可視化能力
Scillus有兩種使用方式:
- 從原始數(shù)據(jù)開始小泉,您應該瀏覽以下所有部分曼库。
- 從數(shù)據(jù)整合好的Seurat對象禀酱,提高繪圖功能憔维,安裝好Scillus后可以直接進入Plotting涛救。
接下來我們將分四個步驟進行解讀:
- 1.Scillus安裝
- 2.配置文件準備
- 3.原始數(shù)據(jù)的處理
- 4.繪圖(可視化)
1.Scillus安裝
請使用以下代碼安裝:
if (!require(devtools)) {
install.packages("devtools")
}
devtools::install_github("xmc811/Scillus", ref = "development")
2.配置文件準備
樣本數(shù)據(jù)
示例使用的數(shù)據(jù)集來自Gaydosik AM等人的研究。它可以從此處下載數(shù)據(jù)埋同。下載后的文件解壓tar xvzf GSE128531.tar.gz
州叠。單個.csv.gz
文件不需要進行解壓縮棵红。為了減少計算時間凶赁,數(shù)據(jù)集僅包含 6 個樣本和每個樣本 300 個細胞。完整的原始數(shù)據(jù)可通過GEO 獲取逆甜。
樣本數(shù)據(jù)格式為:.csv.gz
虱肄,但 Scillus 也適用于 10x Genomics cellranger 輸出格式,如下所示:
$ tree filtered_feature_bc_matrix
filtered_feature_bc_matrix
├── barcodes.tsv.gz
├── features.tsv.gz
└── matrix.mtx.gz
metadata數(shù)據(jù)
由于每個 scRNA-seq 對象的樣本通常不止一個交煞,Scillus 的加載和過濾函數(shù)將生成和處理 Seurat 對象列表咏窿。應向加載函數(shù)提供metadata數(shù)據(jù)。metadata數(shù)據(jù)應至少有兩列:一列名為sample
素征,另一列名為file
或folder
集嵌,具體取決于輸入數(shù)據(jù)格式。對于示例數(shù)據(jù)御毅,metadata數(shù)據(jù)可以通過以下方式構(gòu)建:
library(tidyverse)
a <- list.files("your/path/to/sample/data/GSE128531_RAW", full.names = TRUE)
m <- tibble(file = a,
sample = stringr::str_remove(basename(a), ".csv.gz"),
group = rep(c("CTCL", "Normal"), each = 3))
file | sample | group |
---|---|---|
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-5.csv.gz | CTCL-5 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-6.csv.gz | CTCL-6 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-8.csv.gz | CTCL-8 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-1.csv.gz | HC-1 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-2.csv.gz | HC-2 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-3.csv.gz | HC-3 | Normal |
metada數(shù)據(jù)中的其他相關(guān)信息(例如組根欧、性別、年齡端蛆、治療)都可以加到數(shù)據(jù)表中凤粗,并且它們包含在 Seurat 對象中。此處添加group
列是為了演示目的今豆。
對于 10x Genomics cellranger 輸出嫌拣,metadata數(shù)據(jù)應該有一個列命名folder
(如下表)而不是file
,并且每個文件夾中應該有 3 個文件呆躲,如上所示的樹結(jié)構(gòu)异逐。
folder | sample | group |
---|---|---|
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-5 | CTCL-5 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-6 | CTCL-6 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-8 | CTCL-8 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-1 | HC-1 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-2 | HC-2 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-3 | HC-3 | Normal |
對調(diào)色板的設(shè)置
Scillus 的繪圖功能將結(jié)合調(diào)色板(Palette)設(shè)置,以確保不同類型繪圖中每個變量的著色方案一致插掂。
pal <- tibble(var = c("sample", "group","seurat_clusters"),
pal = c("Set2","Set1","Paired"))
var | pal |
---|---|
sample | Set2 |
group | Set1 |
seurat_clusters | Paired |