單細(xì)胞分析seurat包學(xué)習(xí)筆記2

不同數(shù)據(jù)集聯(lián)合分析

選擇了通過(guò)四種技術(shù)產(chǎn)生的人胰島細(xì)胞數(shù)據(jù)集：CelSeq（GSE81076) CelSeq2（GSE85241）爷怀，F(xiàn)luidigm C1（GSE86469）和SMART-Seq2（E-MTAB-5061）。我們?cè)诖颂?數(shù)據(jù))提供組合的原始數(shù)據(jù)矩陣和相關(guān)的元數(shù)據(jù)文件以便開(kāi)始沿侈。

數(shù)據(jù)集預(yù)處理

加載表達(dá)式矩陣和元數(shù)據(jù)。元數(shù)據(jù)文件包含四個(gè)數(shù)據(jù)集中每個(gè)單元格的技術(shù)（tech列）和單元格類(lèi)型注釋?zhuān)╟ell type列）么翰。

library(Seurat)

pancreas.data <- readRDS(file = "../data/pancreas_expression_matrix.rds")

metadata <- readRDS(file = "../data/pancreas_metadata.rds")

為了構(gòu)建參考，我們將識(shí)別各個(gè)數(shù)據(jù)集之間的“錨點(diǎn)”。首先于游，我們將組合對(duì)象拆分為一個(gè)列表，每個(gè)數(shù)據(jù)集都作為一個(gè)元素垫言。

pancreas <- CreateSeuratObject(pancreas.data, meta.data = metadata)

pancreas.list <- SplitObject(pancreas, split.by = "tech")

在找到錨點(diǎn)之前贰剥，我們執(zhí)行標(biāo)準(zhǔn)預(yù)處理（對(duì)數(shù)標(biāo)準(zhǔn)化），并為每個(gè)錨點(diǎn)單獨(dú)識(shí)別變量要素筷频。請(qǐng)注意蚌成，Seurat v3基于方差穩(wěn)定轉(zhuǎn)換實(shí)現(xiàn)了一種改進(jìn)的變量特征選擇方法（"vst"）

for (i in 1:length(pancreas.list)) {

? ? pancreas.list[[i]] <- NormalizeData(pancreas.list[[i]], verbose = FALSE)

? ? pancreas.list[[i]] <- FindVariableFeatures(pancreas.list[[i]], selection.method = "vst",

? ? ? ? nfeatures = 2000, verbose = FALSE)

}

整合3個(gè)胰島細(xì)胞數(shù)據(jù)集

接下來(lái)，我們使用FindIntegrationAnchors函數(shù)識(shí)別錨點(diǎn)凛捏，該函數(shù)將Seurat對(duì)象列表作為輸入担忧。在這里，我們將三個(gè)對(duì)象集成到一個(gè)引用中（我們將在后面的小插圖中使用第四個(gè)）

我們?cè)谶@里使用所有默認(rèn)參數(shù)來(lái)識(shí)別錨點(diǎn)坯癣，包括數(shù)據(jù)集的“維度”（30;隨意嘗試在寬范圍內(nèi)改變此參數(shù)瓶盛，例如在10到50之間）。

reference.list <- pancreas.list[c("celseq","celseq2","smartseq2")]pancreas.anchors <- FindIntegrationAnchors(object.list = reference.list, dims =1:30)

然后我們將這些錨傳遞給IntegrateData函數(shù)坡锡，該函數(shù)返回一個(gè)Seurat對(duì)象蓬网。

返回的對(duì)象將包含一個(gè)new?Assay，它包含所有單元格的集成（或“批量修正”）表達(dá)式矩陣鹉勒，使它們能夠被聯(lián)合分析帆锋。

pancreas.integrated <- IntegrateData(anchorset = pancreas.anchors, dims =1:30)

運(yùn)行后IntegrateData，該Seurat對(duì)象將包含一個(gè)Assay帶有集成表達(dá)式矩陣的new?禽额。請(qǐng)注意锯厢，原始（未校正的值）仍存儲(chǔ)在“RNA”分析中的對(duì)象中，因此您可以來(lái)回切換脯倒。

然后我們可以使用這個(gè)新的集成矩陣進(jìn)行下游分析和可視化实辑。在這里，我們擴(kuò)展集成數(shù)據(jù)藻丢，運(yùn)行PCA剪撬，并使用UMAP可視化結(jié)果。集成數(shù)據(jù)集按單元格類(lèi)型而不是技術(shù)集群悠反。

library(ggplot2)

library(cowplot)

# switch to integrated assay. The variable features of this assay are automatically set during Integrate Data#

DefaultAssay(pancreas.integrated) <-"integrated"

# Run the standard workflow for visualization and clustering

pancreas.integrated <- ScaleData(pancreas.integrated, verbose =FALSE)

pancreas.integrated <- RunPCA(pancreas.integrated, npcs =30, verbose =FALSE)

pancreas.integrated <- RunUMAP(pancreas.integrated, reduction ="pca", dims =1:30)

p1 <- DimPlot(pancreas.integrated, reduction ="umap", group.by ="tech")

p2 <- DimPlot(pancreas.integrated, reduction ="umap", group.by ="celltype", label =TRUE,repel =TRUE) + NoLegend()

plot_grid(p1, p2)

使用集成參考的細(xì)胞類(lèi)型分類(lèi)

Seurat v3還支持將參考數(shù)據(jù)（或元數(shù)據(jù)）投影到查詢對(duì)象上残黑。雖然許多方法都是守恒的（兩個(gè)程序都以識(shí)別錨點(diǎn)開(kāi)始），但數(shù)據(jù)傳輸和集成之間存在兩個(gè)重要區(qū)別：

在數(shù)據(jù)傳輸中斋否，Seurat不會(huì)更正或修改查詢表達(dá)式數(shù)據(jù)梨水。

在數(shù)據(jù)傳輸中，Seurat有一個(gè)選項(xiàng)（默認(rèn)設(shè)置）將參考的PCA結(jié)構(gòu)投影到查詢上茵臭，而不是學(xué)習(xí)與CCA的聯(lián)合結(jié)構(gòu)疫诽。我們通常建議在scRNA-seq數(shù)據(jù)集之間投影數(shù)據(jù)時(shí)使用此選項(xiàng)。

在找到錨之后，我們使用該TransferData函數(shù)基于參考數(shù)據(jù)（參考單元類(lèi)型標(biāo)簽的向量）對(duì)查詢單元進(jìn)行分類(lèi)奇徒。TransferData返回具有預(yù)測(cè)ID和預(yù)測(cè)分?jǐn)?shù)的矩陣雏亚，我們可以將其添加到查詢?cè)獢?shù)據(jù)中。

pancreas.query <- pancreas.list[["fluidigmc1"]]

pancreas.anchors <- FindTransferAnchors(reference = pancreas.integrated, query = pancreas.query,? ? dims =1:30)

predictions <- TransferData(anchorset = pancreas.anchors, refdata = pancreas.integrated$celltype,? ? dims =1:30)

?pancreas.query <- AddMetaData(pancreas.query, metadata = predictions)

因?yàn)槲覀儚耐暾木C合分析中獲得了原始標(biāo)簽注釋?zhuān)晕覀兛梢栽u(píng)估我們預(yù)測(cè)的細(xì)胞類(lèi)型注釋與完整參考的匹配程度逼龟。在這個(gè)例子中评凝，我們發(fā)現(xiàn)細(xì)胞類(lèi)型分類(lèi)有很高的一致性，超過(guò)97％的細(xì)胞被正確標(biāo)記腺律。

pancreas.query$prediction.match <- pancreas.query$predicted.id == pancreas.query$celltype

table(pancreas.query$prediction.match)

## FALSE? TRUE

##? ? 16? 622

為了進(jìn)一步驗(yàn)證這一點(diǎn)奕短，我們可以檢查特定胰島細(xì)胞群的一些經(jīng)典細(xì)胞類(lèi)型標(biāo)記。請(qǐng)注意匀钧，即使這些細(xì)胞類(lèi)型中的一些僅由一個(gè)或兩個(gè)細(xì)胞（例如ε細(xì)胞）表示翎碑，我們?nèi)匀荒軌蛘_地對(duì)它們進(jìn)行分類(lèi)。

table(pancreas.query$predicted.id)

##? ? ? ? ? ? acinar? ? ? activated_stellate? ? ? ? ?alpha

##? ? ? ? ? ? ? ? 21? ? ? ? ? ? ? ? ? 17? ? ? ? ? ? ? ? ? ? ? ? ?248

##? ? ? ? ? ? ? beta? ? ? ? ? ? ? ? delta? ? ? ? ? ? ? ? ? ?ductal

##? ? ? ? ? ? ? ? 258? ? ? ? ? ? ? ? 22? ? ? ? ? ? ? ? ? ? ? ? 33

##? ? ? ? endothelial? ? ? ? ? ? epsilon? ? ? ? ? ? ? gamma

##? ? ? ? ? ? ? ? 13? ? ? ? ? ? ? ? ? ?1? ? ? ? ? ? ? ? ? ? ? ? ?17

##? ? ? ? macrophage? ? ? ? ? mast? ? ? ? ? ? ? ? schwann

##? ? ? ? ? ? ? ? ? 1? ? ? ? ? ? ? ? ? ? 2? ? ? ? ? ? ? ? ? ? ? ? 5

VlnPlot(pancreas.query, c("REG1A","PPY","SST","GHRL","VWF","SOX10"), group.by ="predicted.id")

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末之斯，一起剝皮案震驚了整個(gè)濱河市日杈，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌佑刷，老刑警劉巖莉擒，帶你破解...
沈念sama閱讀 206,126評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異瘫絮，居然都是意外死亡涨冀，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)麦萤，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)鹿鳖，“玉大人，你說(shuō)我怎么就攤上這事壮莹〕嶂模” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0贊 341
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵命满，是天一觀的道長(zhǎng)涝滴。經(jīng)常有香客問(wèn)我，道長(zhǎng)胶台，這世上最難降的妖魔是什么狭莱？我笑而不...
開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮概作，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘默怨。我一直安慰自己讯榕，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著愚屁，像睡著了一般济竹。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上霎槐，一...
開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1贊 284
城市分裂傳說(shuō)
那天送浊，我揣著相機(jī)與錄音，去河邊找鬼丘跌。笑死袭景，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的闭树。我是一名探鬼主播耸棒，決...
沈念sama閱讀 38,276評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼报辱！你這毒婦竟也來(lái)了与殃？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤碍现，失蹤者是張志新（化名）和其女友劉穎幅疼，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體昼接，經(jīng)...
沈念sama閱讀 43,400評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡爽篷，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辩棒。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片狼忱。...
茶點(diǎn)故事閱讀 37,997評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖一睁，靈堂內(nèi)的尸體忽然破棺而出钻弄，到底是詐尸還是另有隱情，我是刑警寧澤者吁，帶...
沈念sama閱讀 33,646評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布窘俺，位于F島的核電站，受9級(jí)特大地震影響复凳，放射性物質(zhì)發(fā)生泄漏瘤泪。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一育八、第九天我趴在偏房一處隱蔽的房頂上張望对途。院中可真熱鬧，春花似錦髓棋、人聲如沸实檀。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)膳犹。三九已至恬吕，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間须床，已是汗流浹背铐料。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1贊 260
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留豺旬，地道東北人钠惩。一個(gè)月前我還...
沈念sama閱讀 45,423評(píng)論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像哈垢，于是被迫代替她去往敵國(guó)和親妻柒。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評(píng)論 2贊 345

單細(xì)胞分析seurat包學(xué)習(xí)筆記2

不同數(shù)據(jù)集聯(lián)合分析

數(shù)據(jù)集預(yù)處理

整合3個(gè)胰島細(xì)胞數(shù)據(jù)集

使用集成參考的細(xì)胞類(lèi)型分類(lèi)

推薦閱讀更多精彩內(nèi)容