單細(xì)胞||SingleR鑒定細(xì)胞類(lèi)型

SingleR是用于單細(xì)胞RNA測(cè)序(scRNAseq)數(shù)據(jù)的自動(dòng)注釋方法(Aran et al.2019)箱玷。給定具有已知標(biāo)簽的樣本(單細(xì)胞或RNAseq)參考數(shù)據(jù)集窿克,它將基于與參考數(shù)據(jù)的相似性標(biāo)記測(cè)試數(shù)據(jù)集中的新細(xì)胞汗侵。具體來(lái)說(shuō)降铸,對(duì)于每個(gè)測(cè)試單元:

  1. 計(jì)算其表達(dá)譜與每個(gè)參考樣品的表達(dá)譜之間的Spearman相關(guān)性河胎。
  2. 將每個(gè)標(biāo)簽的分?jǐn)?shù)定義為相關(guān)性分布的fixed quantile(默認(rèn)為0.8)勃刨。
  3. 對(duì)所有標(biāo)簽重復(fù)此操作栋烤,然后將得分最高的標(biāo)簽作為此細(xì)胞的注釋谒养。
  4. 選擇性執(zhí)行微調(diào)

安裝

BiocManager::install("SingleR")
BiocManager::install("scRNAseq")

SingleR通過(guò)專(zhuān)用的數(shù)據(jù)檢索功能提供了多個(gè)參考數(shù)據(jù)集(主要來(lái)自大量RNA-seq或微陣列數(shù)據(jù))。例如明郭,我們使用HumanPrimaryCellAtlasData()函數(shù)從人類(lèi)原代細(xì)胞圖集獲得參考數(shù)據(jù)买窟,該函數(shù)返回一個(gè)SummarizedExperiment對(duì)象,該對(duì)象包含帶有樣本級(jí)標(biāo)簽的對(duì)數(shù)表達(dá)值矩陣薯定。

1.使用內(nèi)置的參考

library(SingleR)
hpca.se <- HumanPrimaryCellAtlasData()
hpca.se

導(dǎo)入要檢測(cè)的數(shù)據(jù)集

我們的測(cè)試數(shù)據(jù)集將取自La Manno et al. (2016)始绍。
為了提高速度,我們只選取100個(gè)細(xì)胞來(lái)標(biāo)記細(xì)胞類(lèi)型话侄。

library(scRNAseq)
hESCs <- LaMannoBrainData('human-es')
hESCs <- hESCs[,1:100]
# SingleR() expects log-counts, but the function will also happily take raw
# counts for the test dataset. The reference, however, must have log-values.
library(scater)
hESCs <- logNormCounts(hESCs)

使用hpca.se作為參考對(duì)測(cè)試數(shù)據(jù)集hESCs通過(guò)SingleR()進(jìn)行注釋

默認(rèn)的檢測(cè)marker的方法是largest positive log-fold changes in the per-label medians for each gene.
輸出的每一行都包含單個(gè)細(xì)胞的預(yù)測(cè)結(jié)果亏推。在 fine-tuning(first.labels)之前, fine-tuning()之后labels和after pruning (pruned.labels)之后的細(xì)胞標(biāo)簽年堆,以及相關(guān)的分?jǐn)?shù)吞杭。

pred.hesc <- SingleR(test = hESCs, ref = hpca.se, labels = hpca.se$label.main)
pred.hesc
## DataFrame with 100 rows and 5 columns
##                                          scores         first.labels
##                                        <matrix>          <character>
## 1772122_301_C02  0.347652:0.109547:0.123901:... Neuroepithelial_cell
## 1772122_180_E05  0.361187:0.134934:0.148672:... Neuroepithelial_cell
## 1772122_300_H02  0.446411:0.190084:0.222594:... Neuroepithelial_cell
## 1772122_180_B09  0.373512:0.143537:0.164743:... Neuroepithelial_cell
## 1772122_180_G04  0.357341:0.126511:0.141987:... Neuroepithelial_cell
## ...                                         ...                  ...
## 1772122_299_E07 0.371989:0.169379:0.1986877:... Neuroepithelial_cell
## 1772122_180_D02 0.353314:0.115864:0.1374981:... Neuroepithelial_cell
## 1772122_300_D09 0.348789:0.136732:0.1303042:... Neuroepithelial_cell
## 1772122_298_F09 0.332361:0.141439:0.1437860:... Neuroepithelial_cell
## 1772122_302_A11 0.324928:0.101609:0.0949826:... Neuroepithelial_cell
##                       tuning.scores               labels        pruned.labels
##                         <DataFrame>          <character>          <character>
## 1772122_301_C02 0.1824402:0.0991116 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_E05 0.1375484:0.0647134              Neurons              Neurons
## 1772122_300_H02 0.2757982:0.1369690 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_B09 0.0851623:0.0819878 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_G04 0.1988415:0.1016622 Neuroepithelial_cell Neuroepithelial_cell
## ...                             ...                  ...                  ...
## 1772122_299_E07 0.1760025:0.0922504 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_D02 0.1967609:0.1124805 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_300_D09 0.0816424:0.0221368 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_298_F09 0.1872499:0.0671893 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_302_A11 0.1560800:0.1051322            Astrocyte            Astrocyte

統(tǒng)計(jì)細(xì)胞個(gè)數(shù)

table(pred.hesc$labels)
## 
##            Astrocyte Neuroepithelial_cell              Neurons 
##                   14                   81                    5

2.使用單個(gè)細(xì)胞參考

在這里,我們將使用兩個(gè)人類(lèi)胰腺數(shù)據(jù)集变丧。目的是使用一個(gè)預(yù)先標(biāo)記的數(shù)據(jù)集注釋另一個(gè)未標(biāo)記的數(shù)據(jù)集芽狗。

library(scRNAseq)
sceM <- MuraroPancreasData()
#移除未標(biāo)記的細(xì)胞
sceM <- sceM[,!is.na(sceM$label)]
sceM <- logNormCounts(sceM)
sceG <- GrunPancreasData()
sceG <- sceG[,colSums(counts(sceG)) > 0] # Remove libraries with no counts.
sceG <- logNormCounts(sceG) 
#選取100個(gè)測(cè)試
sceG <- sceG[,1:100]

SingleR(),與之前一樣的用法痒蓬,但是這次使用了marker檢測(cè)模式童擎,該模式考慮了跨細(xì)胞種類(lèi)表達(dá)的差異。在這里攻晒,將使用Wilcoxon ranked sum test來(lái)識(shí)別marker顾复。與默認(rèn)檢測(cè)算法相比,此方法更慢炎辨,但更適合單細(xì)胞數(shù)據(jù)捕透。

pred.grun <- SingleR(test=sceG, ref=sceM, labels=sceM$label, de.method="wilcox")
table(pred.grun$labels)
## 
## acinar   beta  delta   duct 
##     53      4      2     41

3.對(duì)細(xì)胞分?jǐn)?shù)可視化

SingleR提供了強(qiáng)大的可視化工具。 plotScoreHeatmap()顯示所有參考標(biāo)簽上的分?jǐn)?shù),這使用戶(hù)可以檢查整個(gè)數(shù)據(jù)集中預(yù)測(cè)標(biāo)簽的置信度乙嘀。每個(gè)細(xì)胞的實(shí)際分配標(biāo)簽顯示在頂部末购。理想情況下,每個(gè)cell(即熱圖的一列)應(yīng)具有一個(gè)明顯大于其余得分的分?jǐn)?shù)虎谢,表明已將其明確分配給標(biāo)簽盟榴。

plotScoreHeatmap(pred.grun)
image.png

歡迎關(guān)注!

reference:
https://www.nature.com/articles/s41590-018-0276-y
https://bioconductor.org/packages/devel/bioc/vignettes/SingleR/inst/doc/SingleR.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末婴噩,一起剝皮案震驚了整個(gè)濱河市擎场,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌几莽,老刑警劉巖迅办,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異章蚣,居然都是意外死亡站欺,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)纤垂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)矾策,“玉大人,你說(shuō)我怎么就攤上這事峭沦〖炙洌” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵吼鱼,是天一觀的道長(zhǎng)蓬豁。 經(jīng)常有香客問(wèn)我,道長(zhǎng)蛉抓,這世上最難降的妖魔是什么庆尘? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮巷送,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘矛辕。我一直安慰自己笑跛,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布聊品。 她就那樣靜靜地躺著飞蹂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪翻屈。 梳的紋絲不亂的頭發(fā)上陈哑,一...
    開(kāi)封第一講書(shū)人閱讀 51,688評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼惊窖。 笑死刽宪,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的界酒。 我是一名探鬼主播圣拄,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼毁欣!你這毒婦竟也來(lái)了庇谆?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤凭疮,失蹤者是張志新(化名)和其女友劉穎饭耳,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體执解,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡寞肖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了材鹦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逝淹。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖桶唐,靈堂內(nèi)的尸體忽然破棺而出栅葡,到底是詐尸還是另有隱情,我是刑警寧澤尤泽,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布欣簇,位于F島的核電站,受9級(jí)特大地震影響坯约,放射性物質(zhì)發(fā)生泄漏熊咽。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一闹丐、第九天 我趴在偏房一處隱蔽的房頂上張望横殴。 院中可真熱鬧,春花似錦卿拴、人聲如沸衫仑。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)文狱。三九已至,卻和暖如春缘挽,著一層夾襖步出監(jiān)牢的瞬間瞄崇,已是汗流浹背呻粹。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留苏研,地道東北人等浊。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像楣富,于是被迫代替她去往敵國(guó)和親凿掂。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容