單細(xì)胞||SingleR鑒定細(xì)胞類(lèi)型

SingleR是用于單細(xì)胞RNA測(cè)序（scRNAseq）數(shù)據(jù)的自動(dòng)注釋方法（Aran et al.2019）箱玷。給定具有已知標(biāo)簽的樣本（單細(xì)胞或RNAseq）參考數(shù)據(jù)集窿克，它將基于與參考數(shù)據(jù)的相似性標(biāo)記測(cè)試數(shù)據(jù)集中的新細(xì)胞汗侵。具體來(lái)說(shuō)降铸，對(duì)于每個(gè)測(cè)試單元：

計(jì)算其表達(dá)譜與每個(gè)參考樣品的表達(dá)譜之間的Spearman相關(guān)性河胎。
將每個(gè)標(biāo)簽的分?jǐn)?shù)定義為相關(guān)性分布的fixed quantile（默認(rèn)為0.8)勃刨。
對(duì)所有標(biāo)簽重復(fù)此操作栋烤，然后將得分最高的標(biāo)簽作為此細(xì)胞的注釋谒养。
選擇性執(zhí)行微調(diào)

安裝

BiocManager::install("SingleR")
BiocManager::install("scRNAseq")

SingleR通過(guò)專(zhuān)用的數(shù)據(jù)檢索功能提供了多個(gè)參考數(shù)據(jù)集（主要來(lái)自大量RNA-seq或微陣列數(shù)據(jù)）。例如明郭，我們使用HumanPrimaryCellAtlasData()函數(shù)從人類(lèi)原代細(xì)胞圖集獲得參考數(shù)據(jù)买窟，該函數(shù)返回一個(gè)SummarizedExperiment對(duì)象，該對(duì)象包含帶有樣本級(jí)標(biāo)簽的對(duì)數(shù)表達(dá)值矩陣薯定。

1.使用內(nèi)置的參考

library(SingleR)
hpca.se <- HumanPrimaryCellAtlasData()
hpca.se

導(dǎo)入要檢測(cè)的數(shù)據(jù)集

我們的測(cè)試數(shù)據(jù)集將取自La Manno et al. (2016)始绍。
為了提高速度，我們只選取100個(gè)細(xì)胞來(lái)標(biāo)記細(xì)胞類(lèi)型话侄。

library(scRNAseq)
hESCs <- LaMannoBrainData('human-es')
hESCs <- hESCs[,1:100]
# SingleR() expects log-counts, but the function will also happily take raw
# counts for the test dataset. The reference, however, must have log-values.
library(scater)
hESCs <- logNormCounts(hESCs)

使用hpca.se作為參考對(duì)測(cè)試數(shù)據(jù)集hESCs通過(guò)SingleR()進(jìn)行注釋

默認(rèn)的檢測(cè)marker的方法是largest positive log-fold changes in the per-label medians for each gene.
輸出的每一行都包含單個(gè)細(xì)胞的預(yù)測(cè)結(jié)果亏推。在 fine-tuning（first.labels）之前， fine-tuning（）之后labels和after pruning （pruned.labels）之后的細(xì)胞標(biāo)簽年堆，以及相關(guān)的分?jǐn)?shù)吞杭。

pred.hesc <- SingleR(test = hESCs, ref = hpca.se, labels = hpca.se$label.main)
pred.hesc

## DataFrame with 100 rows and 5 columns
##                                          scores         first.labels
##                                        <matrix>          <character>
## 1772122_301_C02  0.347652:0.109547:0.123901:... Neuroepithelial_cell
## 1772122_180_E05  0.361187:0.134934:0.148672:... Neuroepithelial_cell
## 1772122_300_H02  0.446411:0.190084:0.222594:... Neuroepithelial_cell
## 1772122_180_B09  0.373512:0.143537:0.164743:... Neuroepithelial_cell
## 1772122_180_G04  0.357341:0.126511:0.141987:... Neuroepithelial_cell
## ...                                         ...                  ...
## 1772122_299_E07 0.371989:0.169379:0.1986877:... Neuroepithelial_cell
## 1772122_180_D02 0.353314:0.115864:0.1374981:... Neuroepithelial_cell
## 1772122_300_D09 0.348789:0.136732:0.1303042:... Neuroepithelial_cell
## 1772122_298_F09 0.332361:0.141439:0.1437860:... Neuroepithelial_cell
## 1772122_302_A11 0.324928:0.101609:0.0949826:... Neuroepithelial_cell
##                       tuning.scores               labels        pruned.labels
##                         <DataFrame>          <character>          <character>
## 1772122_301_C02 0.1824402:0.0991116 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_E05 0.1375484:0.0647134              Neurons              Neurons
## 1772122_300_H02 0.2757982:0.1369690 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_B09 0.0851623:0.0819878 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_G04 0.1988415:0.1016622 Neuroepithelial_cell Neuroepithelial_cell
## ...                             ...                  ...                  ...
## 1772122_299_E07 0.1760025:0.0922504 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_180_D02 0.1967609:0.1124805 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_300_D09 0.0816424:0.0221368 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_298_F09 0.1872499:0.0671893 Neuroepithelial_cell Neuroepithelial_cell
## 1772122_302_A11 0.1560800:0.1051322            Astrocyte            Astrocyte

統(tǒng)計(jì)細(xì)胞個(gè)數(shù)

table(pred.hesc$labels)

## 
##            Astrocyte Neuroepithelial_cell              Neurons 
##                   14                   81                    5

2.使用單個(gè)細(xì)胞參考

在這里，我們將使用兩個(gè)人類(lèi)胰腺數(shù)據(jù)集变丧。目的是使用一個(gè)預(yù)先標(biāo)記的數(shù)據(jù)集注釋另一個(gè)未標(biāo)記的數(shù)據(jù)集芽狗。

library(scRNAseq)
sceM <- MuraroPancreasData()
#移除未標(biāo)記的細(xì)胞
sceM <- sceM[,!is.na(sceM$label)]
sceM <- logNormCounts(sceM)

sceG <- GrunPancreasData()
sceG <- sceG[,colSums(counts(sceG)) > 0] # Remove libraries with no counts.
sceG <- logNormCounts(sceG) 
#選取100個(gè)測(cè)試
sceG <- sceG[,1:100]

SingleR()，與之前一樣的用法痒蓬，但是這次使用了marker檢測(cè)模式童擎，該模式考慮了跨細(xì)胞種類(lèi)表達(dá)的差異。在這里攻晒，將使用Wilcoxon ranked sum test來(lái)識(shí)別marker顾复。與默認(rèn)檢測(cè)算法相比，此方法更慢炎辨，但更適合單細(xì)胞數(shù)據(jù)捕透。

pred.grun <- SingleR(test=sceG, ref=sceM, labels=sceM$label, de.method="wilcox")
table(pred.grun$labels)

## 
## acinar   beta  delta   duct 
##     53      4      2     41

3.對(duì)細(xì)胞分?jǐn)?shù)可視化

SingleR提供了強(qiáng)大的可視化工具。 plotScoreHeatmap()顯示所有參考標(biāo)簽上的分?jǐn)?shù)，這使用戶(hù)可以檢查整個(gè)數(shù)據(jù)集中預(yù)測(cè)標(biāo)簽的置信度乙嘀。每個(gè)細(xì)胞的實(shí)際分配標(biāo)簽顯示在頂部末购。理想情況下，每個(gè)cell（即熱圖的一列）應(yīng)具有一個(gè)明顯大于其余得分的分?jǐn)?shù)虎谢，表明已將其明確分配給標(biāo)簽盟榴。

plotScoreHeatmap(pred.grun)

image.png

歡迎關(guān)注！

reference:
https://www.nature.com/articles/s41590-018-0276-y
https://bioconductor.org/packages/devel/bioc/vignettes/SingleR/inst/doc/SingleR.html

最后編輯于：2020.09.04 22:12:01

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末婴噩，一起剝皮案震驚了整個(gè)濱河市擎场，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌几莽，老刑警劉巖迅办，帶你破解...
沈念sama閱讀 218,941評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異章蚣，居然都是意外死亡站欺，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,397評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)纤垂，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)矾策，“玉大人，你說(shuō)我怎么就攤上這事峭沦〖炙洌” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,345評(píng)論 0贊 356
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵吼鱼，是天一觀的道長(zhǎng)蓬豁。經(jīng)常有香客問(wèn)我，道長(zhǎng)蛉抓，這世上最難降的妖魔是什么庆尘？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,851評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮巷送，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘矛辕。我一直安慰自己笑跛，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,868評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布聊品。她就那樣靜靜地躺著飞蹂，像睡著了一般。火紅的嫁衣襯著肌膚如雪翻屈。梳的紋絲不亂的頭發(fā)上陈哑，一...
開(kāi)封第一講書(shū)人閱讀 51,688評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音，去河邊找鬼惊窖。笑死刽宪，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的界酒。我是一名探鬼主播圣拄，決...
沈念sama閱讀 40,414評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼毁欣！你這毒婦竟也來(lái)了庇谆？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 39,319評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤凭疮，失蹤者是張志新（化名）和其女友劉穎饭耳，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體执解，經(jīng)...
沈念sama閱讀 45,775評(píng)論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡寞肖，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,945評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了材鹦。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逝淹。...
茶點(diǎn)故事閱讀 40,096評(píng)論 1贊 350
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖桶唐，靈堂內(nèi)的尸體忽然破棺而出栅葡，到底是詐尸還是另有隱情，我是刑警寧澤尤泽，帶...
沈念sama閱讀 35,789評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布欣簇，位于F島的核電站，受9級(jí)特大地震影響坯约，放射性物質(zhì)發(fā)生泄漏熊咽。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,437評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一闹丐、第九天我趴在偏房一處隱蔽的房頂上張望横殴。院中可真熱鬧，春花似錦卿拴、人聲如沸衫仑。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,993評(píng)論 0贊 22
一樁弒父案堕花，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)文狱。三九已至，卻和暖如春缘挽，著一層夾襖步出監(jiān)牢的瞬間瞄崇，已是汗流浹背呻粹。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,107評(píng)論 1贊 271
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留苏研，地道東北人等浊。一個(gè)月前我還...
沈念sama閱讀 48,308評(píng)論 3贊 372
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像楣富，于是被迫代替她去往敵國(guó)和親凿掂。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,037評(píng)論 2贊 355