scRNAseq與scATACseq整合分析

library(Seurat)
library(ggplot2)
library(patchwork)

下載所需要的文件:scATAC-seq, scATAC-seq metadata, scRNA-seq
注釋文件下載如下

#下載注釋文件并解壓
wget ftp://ftp.ensembl.org/pub/grch37/release-87/gtf/homo_sapiens/Homo_sapiens.GRCh37.87.gtf.gz
gunzip Homo_sapiens.GRCh37.87.gtf.gz
peaks <- Read10X_h5("data/atac_v1_pbmc_10k_filtered_peak_bc_matrix.h5")
# create a gene activity matrix from the peak matrix and GTF, using chromosomes 1:22, X, and Y.
# Peaks that fall within gene bodies, or 2kb upstream of a gene, are considered
activity.matrix <- CreateGeneActivityMatrix(peak.matrix = peaks, annotation.file = "data/Homo_sapiens.GRCh37.87.gtf", seq.levels = c(1:22, "X", "Y"), upstream = 2000, verbose = TRUE)

設(shè)置Seurat中的對象拒秘,原始峰值計數(shù)存儲在“ ATAC”Assay叫确,基因表達矩陣存儲在“ RNA”Assay同规。

對象設(shè)置

pbmc.atac <- CreateSeuratObject(counts = peaks, assay = "ATAC", project = "10x_ATAC")
pbmc.atac[["ACTIVITY"]] <- CreateAssayObject(counts = activity.matrix)
meta <- read.table("data/atac_v1_pbmc_10k_singlecell.csv", sep = ",", header = TRUE, row.names = 1, stringsAsFactors = FALSE)
meta <- meta[colnames(pbmc.atac), ]
pbmc.atac <- AddMetaData(pbmc.atac, metadata = meta)
#質(zhì)控,過濾掉scATAC-seq數(shù)據(jù)中總數(shù)少于5K的細胞。
pbmc.atac <- subset(pbmc.atac, subset = nCount_ATAC > 5000)
pbmc.atac$tech <- "atac"

數(shù)據(jù)預(yù)處理

DefaultAssay(pbmc.atac) <- "ACTIVITY"
pbmc.atac <- FindVariableFeatures(pbmc.atac)
pbmc.atac <- NormalizeData(pbmc.atac)
pbmc.atac <- ScaleData(pbmc.atac)
DefaultAssay(pbmc.atac) <- "ATAC"
VariableFeatures(pbmc.atac) <- names(which(Matrix::rowSums(pbmc.atac) > 100))
pbmc.atac <- RunLSI(pbmc.atac, n = 50, scale.max = NULL)
pbmc.atac <- RunUMAP(pbmc.atac, reduction = "lsi", dims = 1:50)

下載已分析的PBMCs數(shù)據(jù)here.

pbmc.rna <- readRDS("../data/pbmc_10k_v3.rds")
pbmc.rna$tech <-"rna"
p1 <- DimPlot(pbmc.atac, reduction = "umap") + NoLegend() + ggtitle("scATAC-seq")
p2 <- DimPlot(pbmc.rna, group.by = "celltype", label = TRUE, repel = TRUE) + NoLegend() + ggtitle("scRNA-seq")
p1 + p2

我們可以識別scATAC-seq數(shù)據(jù)集和scRNA-seq數(shù)據(jù)集之間的錨點,并使用這些錨點將scRNA-seq數(shù)據(jù)中細胞類型標(biāo)簽轉(zhuǎn)移到scATAC-seq細胞。

transfer.anchors <- FindTransferAnchors(reference = pbmc.rna, query = pbmc.atac, features = VariableFeatures(object = pbmc.rna), 
    reference.assay = "RNA", query.assay = "ACTIVITY", reduction = "cca")

為了定義群ID混埠,我們?yōu)閞efdata參數(shù)提供了RNA先前注釋的細胞類型標(biāo)簽的向量。輸出將包含一個矩陣诗轻,其中包含每個ATAC細胞的預(yù)測和置信度分數(shù)钳宪。

celltype.predictions <- TransferData(anchorset = transfer.anchors, refdata = pbmc.rna$celltype, 
    weight.reduction = pbmc.atac[["lsi"]])
pbmc.atac <- AddMetaData(pbmc.atac, metadata = celltype.predictions)

檢查預(yù)測分數(shù)的分布,并可以選擇濾除那些得分較低的細胞

hist(pbmc.atac$prediction.score.max)
abline(v = 0.5, col = "red")
table(pbmc.atac$prediction.score.max > 0.5)

我們可以在scATAC-seq數(shù)據(jù)的UMAP表示形式上查看預(yù)測的細胞類型扳炬,并發(fā)現(xiàn)所轉(zhuǎn)移的標(biāo)簽與UMAP結(jié)構(gòu)高度一致吏颖。

pbmc.atac.filtered <- subset(pbmc.atac, subset = prediction.score.max > 0.5)
pbmc.atac.filtered$predicted.id <- factor(pbmc.atac.filtered$predicted.id, levels = levels(pbmc.rna))  # to make the colors match
p1 <- DimPlot(pbmc.atac.filtered, group.by = "predicted.id", label = TRUE, repel = TRUE) + ggtitle("scATAC-seq cells") + 
    NoLegend() + scale_colour_hue(drop = FALSE)
p2 <- DimPlot(pbmc.rna, group.by = "celltype", label = TRUE, repel = TRUE) + ggtitle("scRNA-seq cells") + 
    NoLegend()
p1 + p2

最后,為了將所有細胞一起可視化恨樟,我們可以將scRNA-seq和scATAC-seq細胞共同嵌入同一低維空間中半醉。

# note that we restrict the imputation to variable genes from scRNA-seq, but could impute the
# full transcriptome if we wanted to
genes.use <- VariableFeatures(pbmc.rna)
refdata <- GetAssayData(pbmc.rna, assay = "RNA", slot = "data")[genes.use, ]

# refdata (input) contains a scRNA-seq expression matrix for the scRNA-seq cells.  imputation
# (output) will contain an imputed scRNA-seq matrix for each of the ATAC cells
imputation <- TransferData(anchorset = transfer.anchors, refdata = refdata, weight.reduction = pbmc.atac[["lsi"]])

# this line adds the imputed data matrix to the pbmc.atac object
pbmc.atac[["RNA"]] <- imputation
coembed <- merge(x = pbmc.rna, y = pbmc.atac)

# Finally, we run PCA and UMAP on this combined object, to visualize the co-embedding of both
# datasets
coembed <- ScaleData(coembed, features = genes.use, do.scale = FALSE)
coembed <- RunPCA(coembed, features = genes.use, verbose = FALSE)
coembed <- RunUMAP(coembed, dims = 1:30)
coembed$celltype <- ifelse(!is.na(coembed$celltype), coembed$celltype, coembed$predicted.id)
p1 <- DimPlot(coembed, group.by = "tech")
p2 <- DimPlot(coembed, group.by = "celltype", label = TRUE, repel = TRUE)
p1 + p2

參考:https://satijalab.org/seurat/v3.2/atacseq_integration_vignette.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市劝术,隨后出現(xiàn)的幾起案子缩多,更是在濱河造成了極大的恐慌,老刑警劉巖养晋,帶你破解...
    沈念sama閱讀 219,188評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件衬吆,死亡現(xiàn)場離奇詭異,居然都是意外死亡绳泉,警方通過查閱死者的電腦和手機逊抡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來零酪,“玉大人冒嫡,你說我怎么就攤上這事∷奈” “怎么了孝凌?”我有些...
    開封第一講書人閱讀 165,562評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長蛔琅。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么罗售? 我笑而不...
    開封第一講書人閱讀 58,893評論 1 295
  • 正文 為了忘掉前任辜窑,我火速辦了婚禮,結(jié)果婚禮上寨躁,老公的妹妹穿的比我還像新娘穆碎。我一直安慰自己,他們只是感情好职恳,可當(dāng)我...
    茶點故事閱讀 67,917評論 6 392
  • 文/花漫 我一把揭開白布所禀。 她就那樣靜靜地躺著,像睡著了一般放钦。 火紅的嫁衣襯著肌膚如雪色徘。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,708評論 1 305
  • 那天操禀,我揣著相機與錄音褂策,去河邊找鬼。 笑死颓屑,一個胖子當(dāng)著我的面吹牛斤寂,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播揪惦,決...
    沈念sama閱讀 40,430評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼遍搞,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了器腋?” 一聲冷哼從身側(cè)響起溪猿,我...
    開封第一講書人閱讀 39,342評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蒂培,沒想到半個月后再愈,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,801評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡护戳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,976評論 3 337
  • 正文 我和宋清朗相戀三年翎冲,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片媳荒。...
    茶點故事閱讀 40,115評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡抗悍,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出钳枕,到底是詐尸還是另有隱情缴渊,我是刑警寧澤,帶...
    沈念sama閱讀 35,804評論 5 346
  • 正文 年R本政府宣布鱼炒,位于F島的核電站衔沼,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜指蚁,卻給世界環(huán)境...
    茶點故事閱讀 41,458評論 3 331
  • 文/蒙蒙 一菩佑、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧凝化,春花似錦稍坯、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至枪向,卻和暖如春勤揩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背遣疯。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評論 1 272
  • 我被黑心中介騙來泰國打工雄可, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人缠犀。 一個月前我還...
    沈念sama閱讀 48,365評論 3 373
  • 正文 我出身青樓数苫,卻偏偏與公主長得像,于是被迫代替她去往敵國和親辨液。 傳聞我的和親對象是個殘疾皇子虐急,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,055評論 2 355

推薦閱讀更多精彩內(nèi)容