Seurat4.0系列教程12：大數(shù)據(jù)集整合的方法

對于非常大的數(shù)據(jù)集撑蚌，標(biāo)準(zhǔn)工作流程有時可能計算成本高得令人望而卻步。在此工作流程中搏屑，我們可采用如下兩種方法提高效率和運(yùn)行時間：

互惠 PCA （RPCA）
基于參考的整合

主要的效率改進(jìn)是使用了FindIntegrationAnchors()。首先睬棚，我們使用互惠 PCA （RPCA）而不是 CCA 來尋找錨點第煮。在使用互惠的 PCA 確定任意兩個數(shù)據(jù)集之間的錨點時抑党，我們將每個數(shù)據(jù)集投影到其他 PCA 空間中，并根據(jù)相同的鄰近要求約束錨點底靠。所有下游整合步驟保持不變害晦，我們能夠"更正"（或協(xié)調(diào)）數(shù)據(jù)集暑中。

此外，我們使用基于參考的整合鳄逾。在標(biāo)準(zhǔn)工作流中稻轨，我們識別所有數(shù)據(jù)集之間的錨點雕凹。雖然這給數(shù)據(jù)集在下游整合中同等的權(quán)重殴俱，但它也可能使計算變得密集。例如线欲，在整合10 個不同的數(shù)據(jù)集時明场，我們需要執(zhí)行 45 次不同的對比李丰。作為替代方案，我們在此介紹了指定一個或多個數(shù)據(jù)集作為整合分析的"參考"趴泌，其余數(shù)據(jù)集被指定為"查詢"數(shù)據(jù)集舟舒。在此工作流中踱讨，我們不會在成對查詢數(shù)據(jù)集之間識別錨點魏蔗，從而減少比較次數(shù)痹筛。例如廓鞠，在將整合10 個數(shù)據(jù)集將其中指定的 1 個數(shù)據(jù)集集成為參考時，我們僅執(zhí)行 9 次比較床佳∽淘纾基于參考的整合可應(yīng)用于log標(biāo)準(zhǔn)化或 SCTransform標(biāo)準(zhǔn)化的數(shù)據(jù)集。

可選的工作流程包括以下步驟：

創(chuàng)建一個seurat對象用來整合
針對每個數(shù)據(jù)集分別執(zhí)行標(biāo)準(zhǔn)化杆麸、基因選擇和歸一化
在列表中的每個對象上運(yùn)行 PCA
整合數(shù)據(jù)集，并進(jìn)行聯(lián)合分析

總的來說浪感，我們觀察到標(biāo)準(zhǔn)工作流程和此處演示的工作流程之間驚人的相似結(jié)果，但計算時間和內(nèi)存顯著減少影兽。如果數(shù)據(jù)集存在高度差異（例如揭斧，跨模式映射或跨物種映射）峻堰，則只能使用一小部分基因來進(jìn)行整合讹开，您可以使用 CCA 得到更好的結(jié)果捐名。

例如，我們將使用來自人類細(xì)胞圖集的"免疫細(xì)胞圖譜"數(shù)據(jù)镶蹋，這些數(shù)據(jù)可以在這里找到成艘。

library(Seurat)

獲取數(shù)據(jù)后，我們首先執(zhí)行標(biāo)準(zhǔn)化和變異基因選擇狰腌。

bm280k.data <- Read10X_h5("../data/ica_bone_marrow_h5.h5")
bm280k <- CreateSeuratObject(counts = bm280k.data, min.cells = 100, min.features = 500)
bm280k.list <- SplitObject(bm280k, split.by = "orig.ident")
bm280k.list <- lapply(X = bm280k.list, FUN = function(x) {
    x <- NormalizeData(x, verbose = FALSE)
    x <- FindVariableFeatures(x, verbose = FALSE)
})

接下來除破，選擇基因用來后續(xù)整合琼腔，并在列表中的每個對象上運(yùn)行 PCA。

features <- SelectIntegrationFeatures(object.list = bm280k.list)
bm280k.list <- lapply(X = bm280k.list, FUN = function(x) {
    x <- ScaleData(x, features = features, verbose = FALSE)
    x <- RunPCA(x, features = features, verbose = FALSE)
})

由于此數(shù)據(jù)集包含男性和女性丹莲，我們將選擇一男一女（BM1 和 BM2）用于基于參考的工作流程光坝。通過檢查XIST基因的表達(dá)來確定性別甥材。

anchors <- FindIntegrationAnchors(object.list = bm280k.list, reference = c(1, 2), reduction = "rpca", 
    dims = 1:50)
bm280k.integrated <- IntegrateData(anchorset = anchors, dims = 1:50)

bm280k.integrated <- ScaleData(bm280k.integrated, verbose = FALSE)
bm280k.integrated <- RunPCA(bm280k.integrated, verbose = FALSE)
bm280k.integrated <- RunUMAP(bm280k.integrated, dims = 1:50)

DimPlot(bm280k.integrated, group.by = "orig.ident")

image.png

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市洲赵，隨后出現(xiàn)的幾起案子鸳惯，更是在濱河造成了極大的恐慌叠萍，老刑警劉巖，帶你破解...
沈念sama閱讀 217,185評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件苛谷，死亡現(xiàn)場離奇詭異辅鲸，居然都是意外死亡腹殿，警方通過查閱死者的電腦和手機(jī)独悴，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,652評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門锣尉，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人悟耘，你說我怎么就攤上這事落蝙≡萦祝” “怎么了筏勒？”我有些...
開封第一講書人閱讀 163,524評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵旺嬉，是天一觀的道長。經(jīng)常有香客問我邪媳，道長捐顷，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,339評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任迅涮，我火速辦了婚禮废赞，結(jié)果婚禮上叮姑，老公的妹妹穿的比我還像新娘唉地。我一直安慰自己传透，他們只是感情好耘沼，可當(dāng)我...
茶點故事閱讀 67,387評論 6贊 391
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布朱盐。她就那樣靜靜地躺著，像睡著了一般兵琳。火紅的嫁衣襯著肌膚如雪狂秘。梳的紋絲不亂的頭發(fā)上躯肌，一...
開封第一講書人閱讀 51,287評論 1贊 301
城市分裂傳說
那天，我揣著相機(jī)與錄音羡榴，去河邊找鬼。笑死运敢，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的传惠。我是一名探鬼主播迄沫，決...
沈念sama閱讀 40,130評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼卦方，長吁一口氣：“原來是場噩夢啊……” “哼羊瘩！你這毒婦竟也來了盼砍？” 一聲冷哼從身側(cè)響起尘吗，我...
開封第一講書人閱讀 38,985評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤浇坐，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后近刘，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體擒贸，經(jīng)...
沈念sama閱讀 45,420評論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,617評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年介劫，在試婚紗的時候發(fā)現(xiàn)自己被綠了徽惋。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片座韵。...
茶點故事閱讀 39,779評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖回右，靈堂內(nèi)的尸體忽然破棺而出隆圆，到底是詐尸還是另有隱情，我是刑警寧澤翔烁，帶...
沈念sama閱讀 35,477評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站蹬屹，受9級特大地震影響侣背，放射性物質(zhì)發(fā)生泄漏慨默。R本人自食惡果不足惜贩耐，卻給世界環(huán)境...
茶點故事閱讀 41,088評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一厦取、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧虾攻，春花似錦铡买、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,716評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽漂坏。三九已至景埃，卻和暖如春顶别，著一層夾襖步出監(jiān)牢的瞬間谷徙，已是汗流浹背筋夏。一陣腳步聲響...
開封第一講書人閱讀 32,857評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留条篷，地道東北人骗随。一個月前我還...
沈念sama閱讀 47,876評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像鸿染，于是被迫代替她去往敵國和親指蚜。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,700評論 2贊 354

Seurat4.0系列教程12：大數(shù)據(jù)集整合的方法

推薦閱讀更多精彩內(nèi)容