scRNAseq與scATACseq整合分析

library(Seurat)
library(ggplot2)
library(patchwork)

下載所需要的文件：scATAC-seq, scATAC-seq metadata, scRNA-seq
注釋文件下載如下

#下載注釋文件并解壓
wget ftp://ftp.ensembl.org/pub/grch37/release-87/gtf/homo_sapiens/Homo_sapiens.GRCh37.87.gtf.gz
gunzip Homo_sapiens.GRCh37.87.gtf.gz

peaks <- Read10X_h5("data/atac_v1_pbmc_10k_filtered_peak_bc_matrix.h5")
# create a gene activity matrix from the peak matrix and GTF, using chromosomes 1:22, X, and Y.
# Peaks that fall within gene bodies, or 2kb upstream of a gene, are considered
activity.matrix <- CreateGeneActivityMatrix(peak.matrix = peaks, annotation.file = "data/Homo_sapiens.GRCh37.87.gtf", seq.levels = c(1:22, "X", "Y"), upstream = 2000, verbose = TRUE)

設(shè)置Seurat中的對象拒秘，原始峰值計數(shù)存儲在“ ATAC”Assay叫确，基因表達矩陣存儲在“ RNA”Assay同规。

對象設(shè)置

pbmc.atac <- CreateSeuratObject(counts = peaks, assay = "ATAC", project = "10x_ATAC")
pbmc.atac[["ACTIVITY"]] <- CreateAssayObject(counts = activity.matrix)
meta <- read.table("data/atac_v1_pbmc_10k_singlecell.csv", sep = ",", header = TRUE, row.names = 1, stringsAsFactors = FALSE)
meta <- meta[colnames(pbmc.atac), ]
pbmc.atac <- AddMetaData(pbmc.atac, metadata = meta)
#質(zhì)控，過濾掉scATAC-seq數(shù)據(jù)中總數(shù)少于5K的細胞。
pbmc.atac <- subset(pbmc.atac, subset = nCount_ATAC > 5000)
pbmc.atac$tech <- "atac"

數(shù)據(jù)預(yù)處理

DefaultAssay(pbmc.atac) <- "ACTIVITY"
pbmc.atac <- FindVariableFeatures(pbmc.atac)
pbmc.atac <- NormalizeData(pbmc.atac)
pbmc.atac <- ScaleData(pbmc.atac)

DefaultAssay(pbmc.atac) <- "ATAC"
VariableFeatures(pbmc.atac) <- names(which(Matrix::rowSums(pbmc.atac) > 100))
pbmc.atac <- RunLSI(pbmc.atac, n = 50, scale.max = NULL)
pbmc.atac <- RunUMAP(pbmc.atac, reduction = "lsi", dims = 1:50)

下載已分析的PBMCs數(shù)據(jù)here.

pbmc.rna <- readRDS("../data/pbmc_10k_v3.rds")
pbmc.rna$tech <-"rna"

p1 <- DimPlot(pbmc.atac, reduction = "umap") + NoLegend() + ggtitle("scATAC-seq")
p2 <- DimPlot(pbmc.rna, group.by = "celltype", label = TRUE, repel = TRUE) + NoLegend() + ggtitle("scRNA-seq")
p1 + p2

我們可以識別scATAC-seq數(shù)據(jù)集和scRNA-seq數(shù)據(jù)集之間的錨點，并使用這些錨點將scRNA-seq數(shù)據(jù)中細胞類型標(biāo)簽轉(zhuǎn)移到scATAC-seq細胞。

transfer.anchors <- FindTransferAnchors(reference = pbmc.rna, query = pbmc.atac, features = VariableFeatures(object = pbmc.rna), 
    reference.assay = "RNA", query.assay = "ACTIVITY", reduction = "cca")

為了定義群ID混埠，我們?yōu)閞efdata參數(shù)提供了RNA先前注釋的細胞類型標(biāo)簽的向量。輸出將包含一個矩陣诗轻，其中包含每個ATAC細胞的預(yù)測和置信度分數(shù)钳宪。

celltype.predictions <- TransferData(anchorset = transfer.anchors, refdata = pbmc.rna$celltype, 
    weight.reduction = pbmc.atac[["lsi"]])
pbmc.atac <- AddMetaData(pbmc.atac, metadata = celltype.predictions)

檢查預(yù)測分數(shù)的分布，并可以選擇濾除那些得分較低的細胞

hist(pbmc.atac$prediction.score.max)
abline(v = 0.5, col = "red")

table(pbmc.atac$prediction.score.max > 0.5)

我們可以在scATAC-seq數(shù)據(jù)的UMAP表示形式上查看預(yù)測的細胞類型扳炬，并發(fā)現(xiàn)所轉(zhuǎn)移的標(biāo)簽與UMAP結(jié)構(gòu)高度一致吏颖。

pbmc.atac.filtered <- subset(pbmc.atac, subset = prediction.score.max > 0.5)
pbmc.atac.filtered$predicted.id <- factor(pbmc.atac.filtered$predicted.id, levels = levels(pbmc.rna))  # to make the colors match
p1 <- DimPlot(pbmc.atac.filtered, group.by = "predicted.id", label = TRUE, repel = TRUE) + ggtitle("scATAC-seq cells") + 
    NoLegend() + scale_colour_hue(drop = FALSE)
p2 <- DimPlot(pbmc.rna, group.by = "celltype", label = TRUE, repel = TRUE) + ggtitle("scRNA-seq cells") + 
    NoLegend()
p1 + p2

最后，為了將所有細胞一起可視化恨樟，我們可以將scRNA-seq和scATAC-seq細胞共同嵌入同一低維空間中半醉。

# note that we restrict the imputation to variable genes from scRNA-seq, but could impute the
# full transcriptome if we wanted to
genes.use <- VariableFeatures(pbmc.rna)
refdata <- GetAssayData(pbmc.rna, assay = "RNA", slot = "data")[genes.use, ]

# refdata (input) contains a scRNA-seq expression matrix for the scRNA-seq cells.  imputation
# (output) will contain an imputed scRNA-seq matrix for each of the ATAC cells
imputation <- TransferData(anchorset = transfer.anchors, refdata = refdata, weight.reduction = pbmc.atac[["lsi"]])

# this line adds the imputed data matrix to the pbmc.atac object
pbmc.atac[["RNA"]] <- imputation
coembed <- merge(x = pbmc.rna, y = pbmc.atac)

# Finally, we run PCA and UMAP on this combined object, to visualize the co-embedding of both
# datasets
coembed <- ScaleData(coembed, features = genes.use, do.scale = FALSE)
coembed <- RunPCA(coembed, features = genes.use, verbose = FALSE)
coembed <- RunUMAP(coembed, dims = 1:30)
coembed$celltype <- ifelse(!is.na(coembed$celltype), coembed$celltype, coembed$predicted.id)

p1 <- DimPlot(coembed, group.by = "tech")
p2 <- DimPlot(coembed, group.by = "celltype", label = TRUE, repel = TRUE)
p1 + p2

參考：https://satijalab.org/seurat/v3.2/atacseq_integration_vignette.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市劝术，隨后出現(xiàn)的幾起案子缩多，更是在濱河造成了極大的恐慌，老刑警劉巖养晋，帶你破解...
沈念sama閱讀 219,188評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件衬吆，死亡現(xiàn)場離奇詭異，居然都是意外死亡绳泉，警方通過查閱死者的電腦和手機逊抡，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,464評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來零酪，“玉大人冒嫡，你說我怎么就攤上這事∷奈” “怎么了孝凌？”我有些...
開封第一講書人閱讀 165,562評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長蛔琅。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么罗售？我笑而不...
開封第一講書人閱讀 58,893評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任辜窑，我火速辦了婚禮，結(jié)果婚禮上寨躁，老公的妹妹穿的比我還像新娘穆碎。我一直安慰自己，他們只是感情好职恳，可當(dāng)我...
茶點故事閱讀 67,917評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布所禀。她就那樣靜靜地躺著，像睡著了一般放钦。火紅的嫁衣襯著肌膚如雪色徘。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,708評論 1贊 305
城市分裂傳說
那天操禀，我揣著相機與錄音褂策，去河邊找鬼。笑死颓屑，一個胖子當(dāng)著我的面吹牛斤寂，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播揪惦，決...
沈念sama閱讀 40,430評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼遍搞，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了器腋？” 一聲冷哼從身側(cè)響起溪猿，我...
開封第一講書人閱讀 39,342評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎蒂培，沒想到半個月后再愈，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,801評論 1贊 317
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡护戳，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,976評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年翎冲，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片媳荒。...
茶點故事閱讀 40,115評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡抗悍，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出钳枕，到底是詐尸還是另有隱情缴渊，我是刑警寧澤，帶...
沈念sama閱讀 35,804評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布鱼炒，位于F島的核電站衔沼，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜指蚁，卻給世界環(huán)境...
茶點故事閱讀 41,458評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一菩佑、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧凝化，春花似錦稍坯、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,008評論 0贊 22
一樁弒父案瞧哟，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至枪向，卻和暖如春勤揩，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背遣疯。一陣腳步聲響...
開封第一講書人閱讀 33,135評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工雄可，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人缠犀。一個月前我還...
沈念sama閱讀 48,365評論 3贊 373
代替公主和親
正文我出身青樓数苫，卻偏偏與公主長得像，于是被迫代替她去往敵國和親辨液。傳聞我的和親對象是個殘疾皇子虐急，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,055評論 2贊 355

scRNAseq與scATACseq整合分析

對象設(shè)置

數(shù)據(jù)預(yù)處理

推薦閱讀更多精彩內(nèi)容