答讀者問(7):關(guān)于doublet

問題

怎么去doublet选侨?挑選出某一大類做小類降維聚類的時候,有人仍然會檢查一下各種大類marker的表達情況然走,這一步是否有必要援制?

1

最有效的方法還是從上游入手,控制細胞數(shù)以及優(yōu)化測序之前的流程芍瑞。

2

不過分析數(shù)據(jù)的人只能從分析的角度來看了晨仑。
一般我會先用軟件預(yù)測,可以參考我之前寫的一篇帖子:單細胞分析實錄(4): doublet檢測拆檬。

這里引出一個問題洪己,去doublet是在哪一步進行:

  • 跑完cellranger得到矩陣,去doublet竟贯,基本QC(基因數(shù)答捕、UMI數(shù)等等)...
  • 跑完cellranger得到矩陣,基本QC(基因數(shù)屑那、UMI數(shù)等等)拱镐,去doublet...

兩種應(yīng)該差別不大。我一般是第一種持际,考慮到基本QC可能會來回換幾次閾值沃琅,所以基本QC這一步應(yīng)該相對靠后,省得再跑doublet這一步

軟件一般我會用多個选酗,兩個軟件同時報告為doublet的cellular barcode阵难,我會挑出來去掉。

3

除此之外芒填,我還會用一些經(jīng)典的marker來找doublet呜叫。(這種方法也能用來注釋細胞)

celltype_marker=c(
  "Epcam",#上皮細胞 epithelial
  "Pecam1","Cdh5",#內(nèi)皮細胞 endothelial
  "Pdgfra","Col1a1","Col3a1",#成纖維細胞 fibroblasts
  "Fcgr1","Cd163","Aif1","Cd68",#髓系細胞 myeloid
  "Ms4a1",#B細胞
  "Cd3g","Cd3e",#T細胞
  "Ncr1",#NK細胞
  "Ptprc"#免疫細胞
)
VlnPlot(allseu,features = celltype_marker,pt.size = 0,ncol = 2)

類似這樣空繁,如果某群cluster表達了不太可能同時出現(xiàn)的gene,則有可能是doublet朱庆。當(dāng)然也要憑借一些經(jīng)驗盛泡,比如成纖維的marker可能在內(nèi)皮細胞中有一定程度的表達,CD4(一個基因)可能在髓系細胞中有一定程度的表達娱颊,這是可能的傲诵。但T細胞高表達EPCAM,我是不相信的箱硕。

4

還有一個經(jīng)驗之談:用marker鑒定doublet的時候拴竹,被鑒定出來的doublet(這是前提),可能單獨聚出來成為一個小團剧罩,也有可能看上去像是連接某兩個亞群的橋梁栓拜。

5

另外,上述都是針對大類clustering的描述惠昔,做小類的reclustering的時候幕与,我一般不考慮去小類之間的doublet,一是因為很難區(qū)分镇防,二是小類之間的doublet形成概率比大類doublet形成概率低很多啦鸣。


6

還有一種情況(比較少見),是樣本之間的doublet来氧。這時诫给,利用SNP可以比較精確地區(qū)分出sample1, sample2, 以及doublet(sample1+sample2)。

目前已經(jīng)有一些工具可以從scRNA-seq數(shù)據(jù)中獲取少量SNP信息啦扬,并達到上述目的蝙搔,比如Souporcell(原文https://www.nature.com/articles/s41592-020-0820-1),準確性還可以考传。

但多數(shù)情況還是一個樣本一測吃型,這種思路可行性不大。


回到第2個小問題

挑選出某一大類做小類降維聚類的時候僚楞,有人仍然會檢查一下各種大類marker的表達情況勤晚,這一步是否有必要?

很有必要泉褐。在做reclustering這一步的時候赐写,檢查大類marker的表達,我經(jīng)常會看到其他大類細胞(或者是這類細胞與其他大類細胞組成的doublet)亂入膜赃。之前沒做過這一步的朋友挺邀,可以試試,會有驚喜(嚇)。

這時最嚴謹?shù)淖龇ㄊ前褋y入的其他大類細胞放回它應(yīng)該去的地方,單細胞聚類注釋就是一個“分分合合”的過程,也是最耗時最繁瑣的過程测蹲。

如果數(shù)量不多畸肆,直接去掉鸟悴,影響也不大。

如果是這類細胞與其他大類細胞組成的doublet,直接去掉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末哗总,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子倍试,更是在濱河造成了極大的恐慌讯屈,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件县习,死亡現(xiàn)場離奇詭異耻煤,居然都是意外死亡,警方通過查閱死者的電腦和手機准颓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來棺妓,“玉大人攘已,你說我怎么就攤上這事×埽” “怎么了样勃?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長性芬。 經(jīng)常有香客問我峡眶,道長,這世上最難降的妖魔是什么植锉? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任辫樱,我火速辦了婚禮,結(jié)果婚禮上俊庇,老公的妹妹穿的比我還像新娘狮暑。我一直安慰自己,他們只是感情好辉饱,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布搬男。 她就那樣靜靜地躺著,像睡著了一般彭沼。 火紅的嫁衣襯著肌膚如雪缔逛。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機與錄音褐奴,去河邊找鬼按脚。 笑死,一個胖子當(dāng)著我的面吹牛歉糜,可吹牛的內(nèi)容都是我干的乘寒。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼匪补,長吁一口氣:“原來是場噩夢啊……” “哼伞辛!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起夯缺,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤蚤氏,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后踊兜,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體竿滨,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年捏境,在試婚紗的時候發(fā)現(xiàn)自己被綠了于游。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡垫言,死狀恐怖贰剥,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情筷频,我是刑警寧澤蚌成,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站凛捏,受9級特大地震影響担忧,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜坯癣,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一瓶盛、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧示罗,春花似錦蓬网、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至禽额,卻和暖如春锯厢,著一層夾襖步出監(jiān)牢的瞬間皮官,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工实辑, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留捺氢,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓剪撬,卻偏偏與公主長得像摄乒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子残黑,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容