單細(xì)胞分析seurat包學(xué)習(xí)筆記2

不同數(shù)據(jù)集聯(lián)合分析

選擇了通過(guò)四種技術(shù)產(chǎn)生的人胰島細(xì)胞數(shù)據(jù)集:CelSeq(GSE81076) CelSeq2(GSE85241)爷怀,F(xiàn)luidigm C1(GSE86469)和SMART-Seq2(E-MTAB-5061)。我們?cè)诖颂?數(shù)據(jù))提供組合的原始數(shù)據(jù)矩陣和相關(guān)的元數(shù)據(jù)文件以便開(kāi)始沿侈。

數(shù)據(jù)集預(yù)處理

加載表達(dá)式矩陣和元數(shù)據(jù)。元數(shù)據(jù)文件包含四個(gè)數(shù)據(jù)集中每個(gè)單元格的技術(shù)(tech列)和單元格類(lèi)型注釋?zhuān)╟ell type列)么翰。

library(Seurat)

pancreas.data <- readRDS(file = "../data/pancreas_expression_matrix.rds")

metadata <- readRDS(file = "../data/pancreas_metadata.rds")

為了構(gòu)建參考,我們將識(shí)別各個(gè)數(shù)據(jù)集之間的“錨點(diǎn)”。首先于游,我們將組合對(duì)象拆分為一個(gè)列表,每個(gè)數(shù)據(jù)集都作為一個(gè)元素垫言。

pancreas <- CreateSeuratObject(pancreas.data, meta.data = metadata)

pancreas.list <- SplitObject(pancreas, split.by = "tech")

在找到錨點(diǎn)之前贰剥,我們執(zhí)行標(biāo)準(zhǔn)預(yù)處理(對(duì)數(shù)標(biāo)準(zhǔn)化),并為每個(gè)錨點(diǎn)單獨(dú)識(shí)別變量要素筷频。請(qǐng)注意蚌成,Seurat v3基于方差穩(wěn)定轉(zhuǎn)換實(shí)現(xiàn)了一種改進(jìn)的變量特征選擇方法("vst")

for (i in 1:length(pancreas.list)) {

? ? pancreas.list[[i]] <- NormalizeData(pancreas.list[[i]], verbose = FALSE)

? ? pancreas.list[[i]] <- FindVariableFeatures(pancreas.list[[i]], selection.method = "vst",

? ? ? ? nfeatures = 2000, verbose = FALSE)

}

整合3個(gè)胰島細(xì)胞數(shù)據(jù)集

接下來(lái),我們使用FindIntegrationAnchors函數(shù)識(shí)別錨點(diǎn)凛捏,該函數(shù)將Seurat對(duì)象列表作為輸入担忧。在這里,我們將三個(gè)對(duì)象集成到一個(gè)引用中(我們將在后面的小插圖中使用第四個(gè))

我們?cè)谶@里使用所有默認(rèn)參數(shù)來(lái)識(shí)別錨點(diǎn)坯癣,包括數(shù)據(jù)集的“維度”(30;隨意嘗試在寬范圍內(nèi)改變此參數(shù)瓶盛,例如在10到50之間)。

reference.list <- pancreas.list[c("celseq","celseq2","smartseq2")]pancreas.anchors <- FindIntegrationAnchors(object.list = reference.list, dims =1:30)

然后我們將這些錨傳遞給IntegrateData函數(shù)坡锡,該函數(shù)返回一個(gè)Seurat對(duì)象蓬网。

返回的對(duì)象將包含一個(gè)new?Assay,它包含所有單元格的集成(或“批量修正”)表達(dá)式矩陣鹉勒,使它們能夠被聯(lián)合分析帆锋。

pancreas.integrated <- IntegrateData(anchorset = pancreas.anchors, dims =1:30)

運(yùn)行后IntegrateData,該Seurat對(duì)象將包含一個(gè)Assay帶有集成表達(dá)式矩陣的new?禽额。請(qǐng)注意锯厢,原始(未校正的值)仍存儲(chǔ)在“RNA”分析中的對(duì)象中,因此您可以來(lái)回切換脯倒。

然后我們可以使用這個(gè)新的集成矩陣進(jìn)行下游分析和可視化实辑。在這里,我們擴(kuò)展集成數(shù)據(jù)藻丢,運(yùn)行PCA剪撬,并使用UMAP可視化結(jié)果。集成數(shù)據(jù)集按單元格類(lèi)型而不是技術(shù)集群悠反。

library(ggplot2)

library(cowplot)

# switch to integrated assay. The variable features of this assay are automatically set during Integrate Data#

DefaultAssay(pancreas.integrated) <-"integrated"

# Run the standard workflow for visualization and clustering

pancreas.integrated <- ScaleData(pancreas.integrated, verbose =FALSE)

pancreas.integrated <- RunPCA(pancreas.integrated, npcs =30, verbose =FALSE)

pancreas.integrated <- RunUMAP(pancreas.integrated, reduction ="pca", dims =1:30)

p1 <- DimPlot(pancreas.integrated, reduction ="umap", group.by ="tech")

p2 <- DimPlot(pancreas.integrated, reduction ="umap", group.by ="celltype", label =TRUE,repel =TRUE) + NoLegend()

plot_grid(p1, p2)



使用集成參考的細(xì)胞類(lèi)型分類(lèi)

Seurat v3還支持將參考數(shù)據(jù)(或元數(shù)據(jù))投影到查詢對(duì)象上残黑。雖然許多方法都是守恒的(兩個(gè)程序都以識(shí)別錨點(diǎn)開(kāi)始),但數(shù)據(jù)傳輸和集成之間存在兩個(gè)重要區(qū)別:

在數(shù)據(jù)傳輸中斋否,Seurat不會(huì)更正或修改查詢表達(dá)式數(shù)據(jù)梨水。

在數(shù)據(jù)傳輸中,Seurat有一個(gè)選項(xiàng)(默認(rèn)設(shè)置)將參考的PCA結(jié)構(gòu)投影到查詢上茵臭,而不是學(xué)習(xí)與CCA的聯(lián)合結(jié)構(gòu)疫诽。我們通常建議在scRNA-seq數(shù)據(jù)集之間投影數(shù)據(jù)時(shí)使用此選項(xiàng)。

在找到錨之后,我們使用該TransferData函數(shù)基于參考數(shù)據(jù)(參考單元類(lèi)型標(biāo)簽的向量)對(duì)查詢單元進(jìn)行分類(lèi)奇徒。TransferData返回具有預(yù)測(cè)ID和預(yù)測(cè)分?jǐn)?shù)的矩陣雏亚,我們可以將其添加到查詢?cè)獢?shù)據(jù)中。

pancreas.query <- pancreas.list[["fluidigmc1"]]

pancreas.anchors <- FindTransferAnchors(reference = pancreas.integrated, query = pancreas.query,? ? dims =1:30)

predictions <- TransferData(anchorset = pancreas.anchors, refdata = pancreas.integrated$celltype,? ? dims =1:30)

?pancreas.query <- AddMetaData(pancreas.query, metadata = predictions)

因?yàn)槲覀儚耐暾木C合分析中獲得了原始標(biāo)簽注釋?zhuān)晕覀兛梢栽u(píng)估我們預(yù)測(cè)的細(xì)胞類(lèi)型注釋與完整參考的匹配程度逼龟。在這個(gè)例子中评凝,我們發(fā)現(xiàn)細(xì)胞類(lèi)型分類(lèi)有很高的一致性,超過(guò)97%的細(xì)胞被正確標(biāo)記腺律。

pancreas.query$prediction.match <- pancreas.query$predicted.id == pancreas.query$celltype

table(pancreas.query$prediction.match)

##

## FALSE? TRUE

##? ? 16? 622

為了進(jìn)一步驗(yàn)證這一點(diǎn)奕短,我們可以檢查特定胰島細(xì)胞群的一些經(jīng)典細(xì)胞類(lèi)型標(biāo)記。請(qǐng)注意匀钧,即使這些細(xì)胞類(lèi)型中的一些僅由一個(gè)或兩個(gè)細(xì)胞(例如ε細(xì)胞)表示翎碑,我們?nèi)匀荒軌蛘_地對(duì)它們進(jìn)行分類(lèi)。

table(pancreas.query$predicted.id)

##

##? ? ? ? ? ? acinar? ? ? activated_stellate? ? ? ? ?alpha

##? ? ? ? ? ? ? ? 21? ? ? ? ? ? ? ? ? 17? ? ? ? ? ? ? ? ? ? ? ? ?248

##? ? ? ? ? ? ? beta? ? ? ? ? ? ? ? delta? ? ? ? ? ? ? ? ? ?ductal

##? ? ? ? ? ? ? ? 258? ? ? ? ? ? ? ? 22? ? ? ? ? ? ? ? ? ? ? ? 33

##? ? ? ? endothelial? ? ? ? ? ? epsilon? ? ? ? ? ? ? gamma

##? ? ? ? ? ? ? ? 13? ? ? ? ? ? ? ? ? ?1? ? ? ? ? ? ? ? ? ? ? ? ?17

##? ? ? ? macrophage? ? ? ? ? mast? ? ? ? ? ? ? ? schwann

##? ? ? ? ? ? ? ? ? 1? ? ? ? ? ? ? ? ? ? 2? ? ? ? ? ? ? ? ? ? ? ? 5

VlnPlot(pancreas.query, c("REG1A","PPY","SST","GHRL","VWF","SOX10"), group.by ="predicted.id")


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末之斯,一起剝皮案震驚了整個(gè)濱河市日杈,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌佑刷,老刑警劉巖莉擒,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異瘫絮,居然都是意外死亡涨冀,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)麦萤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)鹿鳖,“玉大人,你說(shuō)我怎么就攤上這事壮莹〕嶂模” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵命满,是天一觀的道長(zhǎng)涝滴。 經(jīng)常有香客問(wèn)我,道長(zhǎng)胶台,這世上最難降的妖魔是什么狭莱? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮概作,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘默怨。我一直安慰自己讯榕,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著愚屁,像睡著了一般济竹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上霎槐,一...
    開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1 284
  • 那天送浊,我揣著相機(jī)與錄音,去河邊找鬼丘跌。 笑死袭景,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的闭树。 我是一名探鬼主播耸棒,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼报辱!你這毒婦竟也來(lái)了与殃?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤碍现,失蹤者是張志新(化名)和其女友劉穎幅疼,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體昼接,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡爽篷,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辩棒。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片狼忱。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖一睁,靈堂內(nèi)的尸體忽然破棺而出钻弄,到底是詐尸還是另有隱情,我是刑警寧澤者吁,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布窘俺,位于F島的核電站,受9級(jí)特大地震影響复凳,放射性物質(zhì)發(fā)生泄漏瘤泪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一育八、第九天 我趴在偏房一處隱蔽的房頂上張望对途。 院中可真熱鬧,春花似錦髓棋、人聲如沸实檀。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)膳犹。三九已至恬吕,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間须床,已是汗流浹背铐料。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留豺旬,地道東北人钠惩。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像哈垢,于是被迫代替她去往敵國(guó)和親妻柒。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容