單細(xì)胞基因集打分實(shí)操之irGSEA

Immugent在推文一文帶你了解單細(xì)胞數(shù)據(jù)基因集打分的所有算法中滓走,介紹了11種常用的對(duì)單細(xì)胞數(shù)據(jù)進(jìn)行基因集打分的算法沛鸵,其中提到了一個(gè)非常給力的R包:irGSEA液斜。它內(nèi)置了"AUCell", "UCell", "singscore", "ssgsea"四種算法,并且可以將多種基因集的富集分?jǐn)?shù)矩陣直接保存到Seurat對(duì)象中,那么這期推文Immugent就給大家用示例數(shù)據(jù)來演示一下這個(gè)包的常見用法蔼两。

首先就是包的安裝問題,可以參考我前一篇文章的代碼。此外算利,Immugent已經(jīng)咨詢過包的作者,最好是用最新版(4.1) 的R上進(jìn)行安裝泳姐,但是小編用R version 4.0.5 (2021-03-31)也裝上這個(gè)包了效拭,只是在調(diào)用其中一個(gè)函數(shù)時(shí)出現(xiàn)了以下問題:

圖片

原因是這個(gè)包鏈接到的"GSVA"包函數(shù)是最新版的1.40.1;而4.05版本的R只能裝低版本的“GSVA"包,能裝上的最高版本是1.38.2的缎患。

圖片
圖片

所以在低版本上即使能裝上irGSEA包慕的,其中的 “ssgsea” 算法是不能使用的,但是從專業(yè)角度看挤渔,"AUCell", "UCell", "singscore"更適用于單細(xì)胞數(shù)據(jù)肮街,所以使用前3種算法就足夠使用的了。

好了判导,下面開始展示具體的用法嫉父,為了每位伙伴都能很好的復(fù)現(xiàn),小編就用Seuratdata的數(shù)據(jù)進(jìn)行演示眼刃。

-------------------------------1.準(zhǔn)備數(shù)據(jù)---------------------------

library(SeuratData)# view all available datasets
View(AvailableData())
InstallData("pbmc3k")# download 3k PBMCs from 10X Genomics

library(Seurat)# loading dataset

data("pbmc3k.final")
pbmc3k.final <- UpdateSeuratObject(pbmc3k.final)
pbmc3k.final
DimPlot(pbmc3k.final, reduction = "umap",
group.by = "seurat_annotations",label = T) + NoLegend()

圖片

我們可以看到這是來源于人外周血的單細(xì)胞數(shù)據(jù)绕辖,包含各種免疫細(xì)胞,其主要分為三大塊:B細(xì)胞鸟整,T細(xì)胞和髓系淋巴細(xì)胞引镊。下面就是要使用上述的四種方法計(jì)算基因集的富集分?jǐn)?shù)了,這里我們使用人的Hallmark數(shù)據(jù)集來進(jìn)行展示篮条。

-------------------------------2.計(jì)算富集分?jǐn)?shù)---------------------------

library(UCell)
library(irGSEA)

Idents(pbmc3k.final) <- pbmc3k.final$seurat_annotations #定義要分析的細(xì)胞亞群
pbmc3k.final <- irGSEA.score(object = pbmc3k.final, assay = "RNA",
slot = "data", seeds = 123, ncores = 1,
min.cells = 3, min.feature = 0,
custom = F, geneset = NULL, msigdb = T,
species = "Homo sapiens", category = "H",
subcategory = NULL, geneid = "symbol",
method = c("AUCell", "UCell", "singscore",
"ssgsea"),
aucell.MaxRank = NULL, ucell.MaxRank = NULL,
kcdf = 'Gaussian')

Seurat::Assays(pbmc3k.final)

這個(gè)包最方便的就是可以通過一個(gè)函數(shù)直接使用4種算法弟头,同時(shí)計(jì)算目的基因集的富集分?jǐn)?shù),而且函數(shù)還被作者進(jìn)行優(yōu)化涉茧,使得大大節(jié)約了所需計(jì)算時(shí)間赴恨。此外,因?yàn)閮?nèi)置了”msigdb“包伴栓,我們可以方便的計(jì)算人和其它模式物種的各種常見基因集伦连,如GO, KEGG, Hallmark等。

在計(jì)算出所有細(xì)胞的通路富集分?jǐn)?shù)后钳垮,接下來就需要找出差異的通路進(jìn)行重點(diǎn)分析了惑淳。

-------------------------------3.整合差異基因集---------------------------

result.dge <- irGSEA.integrate(object = pbmc3k.final,
group.by = "seurat_annotations",
metadata = NULL, col.name = NULL,
method = c("AUCell","UCell","singscore",
"ssgsea"))

class(result.dge) #> [1] "list"

為了評(píng)估基因集是否在某個(gè)細(xì)胞亞群中富集,irGSEA通過Wilcox檢驗(yàn)計(jì)算富集分?jǐn)?shù)矩陣中的差異基因集(差異基因的過濾標(biāo)準(zhǔn)為為校正后P值小于0.05)饺窿。然后歧焦,又通過RobustRankAggreg包中的秩聚合算法(RRA)對(duì)差異分析的結(jié)果進(jìn)行綜合評(píng)估,并篩選出在大部分基因集富集分析方法中顯著富集的基因集(綜合評(píng)估的過濾標(biāo)準(zhǔn)為P值小于0.05)肚医。但是小編感覺這里只能對(duì)所有的細(xì)胞亞群同時(shí)進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)绢馍,而實(shí)際應(yīng)用中我們往往只關(guān)注某兩群細(xì)胞,因此如果未來能開發(fā)出像Seurat那樣可以做到指定兩群細(xì)胞進(jìn)行統(tǒng)計(jì)學(xué)差異檢驗(yàn)?zāi)蔷透昝懒恕?/p>

這個(gè)包的另一個(gè)亮點(diǎn)就是可以做出很多好看的圖肠套,下面就簡單做出幾個(gè)圖展示一下

-------------------------------4.可視化展示---------------------------

irGSEA.barplot.plot <- irGSEA.barplot(object = result.dge,
method = c("AUCell", "UCell", "singscore",
"ssgsea"))
irGSEA.barplot

圖片

halfvlnplot <- irGSEA.halfvlnplot(object = pbmc3k.final,
method = "UCell",
show.geneset = "HALLMARK-INFLAMMATORY-RESPONSE")
halfvlnplot

圖片

ridgeplot <- irGSEA.ridgeplot(object = pbmc3k.final,
method = "UCell",
show.geneset = "HALLMARK-INFLAMMATORY-RESPONSE")
ridgeplot

圖片

上面說到我們可以對(duì)經(jīng)典數(shù)據(jù)集進(jìn)行分析舰涌,但現(xiàn)實(shí)操作中我們往往想要對(duì)自己構(gòu)建的目的基因集來進(jìn)行富集分析,那么下面小編就進(jìn)行展示如果構(gòu)建自己的目的基因集你稚;此外瓷耙,值得一提的是"UCell", "singscore"函數(shù)可以通過正反向基因同時(shí)進(jìn)行計(jì)算富集分?jǐn)?shù)朱躺,那我們接下來就來看一下效果如何

-------------------------------5.個(gè)性化分析---------------------------

markers <- list()
markers$TcellN <- c("CD3E+","CD3G+","ITGAE-", "ITGAM-")

markers$TcellY <- c("CD3E+","CD3G+","CD19-","CD79A-","CD79B-","FGFBP2-", "KLRF1-","ITGAE-", "ITGAM-")

pbmc3k.final <- irGSEA.score(object = pbmc3k.final, assay = "RNA", slot = "data", seeds = 123, ncores = 1,msigdb=F, custom = T, geneset = markers, method = c( "UCell", "singscore"), kcdf = 'Gaussian')

scatterplot <- irGSEA.density.scatterplot(object = pbmc3k.final,
method = "singscore",
show.geneset = c("TcellN","TcellY")
reduction = "umap")
scatterplot

圖片

咋一看用這兩種不同的基因集做出的富集分?jǐn)?shù)很類似,但是細(xì)細(xì)看來就有不一樣的發(fā)現(xiàn)哺徊。如右邊那群髓系淋巴細(xì)胞室琢,在沒有排除B細(xì)胞的marker基因時(shí)的得分低于右側(cè)排除后的,這是因?yàn)樗柘盗馨图?xì)胞不表達(dá)B細(xì)胞的marker落追,用這種方式做出的綜合評(píng)分會(huì)適當(dāng)加分盈滴,而且這種影響隨著基因數(shù)目增加而增加;此外轿钠,雖然T細(xì)胞群和其它群比較顏色上沒有差異巢钓,但是打分范圍右側(cè)高于左側(cè),也可以認(rèn)為疗垛,髓系的打分沒有變症汹,是B細(xì)胞群變得更低了,這其實(shí)是更有利于發(fā)現(xiàn)差異的贷腕。

好了背镇,說到這,關(guān)于單細(xì)胞基因集打分的故事就說完了泽裳。接下來小編將會(huì)介紹另一個(gè)基于bulk數(shù)據(jù)進(jìn)行打分的強(qiáng)大R包:IOBR瞒斩,敬請(qǐng)期待!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末涮总,一起剝皮案震驚了整個(gè)濱河市胸囱,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瀑梗,老刑警劉巖烹笔,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異抛丽,居然都是意外死亡谤职,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門亿鲜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來柬帕,“玉大人,你說我怎么就攤上這事狡门。” “怎么了锅很?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵其馏,是天一觀的道長。 經(jīng)常有香客問我爆安,道長叛复,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮褐奥,結(jié)果婚禮上咖耘,老公的妹妹穿的比我還像新娘。我一直安慰自己撬码,他們只是感情好儿倒,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著呜笑,像睡著了一般夫否。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上叫胁,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天凰慈,我揣著相機(jī)與錄音,去河邊找鬼驼鹅。 笑死微谓,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的输钩。 我是一名探鬼主播豺型,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼张足!你這毒婦竟也來了触创?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤为牍,失蹤者是張志新(化名)和其女友劉穎哼绑,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體碉咆,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡抖韩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了疫铜。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片茂浮。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖壳咕,靈堂內(nèi)的尸體忽然破棺而出席揽,到底是詐尸還是另有隱情,我是刑警寧澤谓厘,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布幌羞,位于F島的核電站,受9級(jí)特大地震影響竟稳,放射性物質(zhì)發(fā)生泄漏属桦。R本人自食惡果不足惜熊痴,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望聂宾。 院中可真熱鬧果善,春花似錦、人聲如沸系谐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蔚鸥。三九已至惜论,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間止喷,已是汗流浹背馆类。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留弹谁,地道東北人乾巧。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像预愤,于是被迫代替她去往敵國和親沟于。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容