Cellranger原理介紹(中)

在上篇文章中犯祠,我們著重介紹了Cell Ranger 進(jìn)行基因比對的理論模型榛瓮,還不太清楚的同學(xué)可以點擊鏈接進(jìn)行回顧:【 Cell Ranger 知多少(上)

Cell Ranger 進(jìn)行細(xì)胞識別的算法直接影響了我們可以獲得的高質(zhì)量細(xì)胞的數(shù)量及數(shù)據(jù)質(zhì)量潘悼,那么本篇文章繼續(xù)為大家介紹 Cell Ranger 是如何進(jìn)行細(xì)胞計數(shù)回收的遣铝。

細(xì)胞識別的難點

在基于 droplet 方法的單細(xì)胞技術(shù)中,通常認(rèn)為含有細(xì)胞的液滴應(yīng)該含有更多的RNA顶捷,因此其在 UMI 總量上應(yīng)該與空細(xì)胞(背景噪音)存在明顯的區(qū)分(也就是我們常說的 barcodes 排序圖上的拐點)挂绰。然而實際上微滴間不同的擴(kuò)增效率會導(dǎo)致一些較小的細(xì)胞跟空細(xì)胞在 UMI 總數(shù)上是相近的,無法僅通過 UMI 總數(shù)很好地區(qū)分空細(xì)胞和非空細(xì)胞服赎。尤其當(dāng)樣本中混雜了不同大小的細(xì)胞葵蒂,例如在腫瘤樣本中一般混雜著體型較大的腫瘤細(xì)胞和較小的腫瘤浸潤淋巴細(xì)胞,浸潤淋巴細(xì)胞則較難與空細(xì)胞區(qū)分重虑。

為解決這一難題践付,Cell Ranger 的算法采用了兩步法分別基于 UMI 閾值識別高 RNA 含量細(xì)胞以及基于表達(dá)譜識別低 RNA 含量細(xì)胞。

Cell Ranger 兩步法

1. 第一步缺厉,選取一個 UMI 總數(shù)的閾值永高,所有大于這個閾值的 barcodes 被識別為細(xì)胞隧土。這一步保證了高 RNA 含量的 barcodes 被保留。****

具體的算法是:將 UMI 計數(shù)從高到低進(jìn)行排序命爬,根據(jù)預(yù)期細(xì)胞數(shù) N(軟件默認(rèn)N=3000)曹傀,排名前 N 個細(xì)胞中的 99 分位 UMI 數(shù)值記為 m,將所有 UMI 計數(shù)大于 m/10 這一閾值的 barcodes 標(biāo)記為高質(zhì)量細(xì)胞饲宛。

2. ****剩余未通過閾值的 barcodes 則進(jìn)行第二步的篩選皆愉,根據(jù)與空細(xì)胞 RNA 表達(dá)譜是否存在顯著差異來回收潛在的低 RNA 含量細(xì)胞。

此算法基于 Lun et al. 2019 年發(fā)表的算法 EmptyDrops艇抠。

圖片

a. 首先選取一組低 UMI 計數(shù)的 barcodes 作為背景集(來代表空細(xì)胞)幕庐,用這部分 barcodes 的表達(dá)譜構(gòu)建一個“背景模型”**


Tips:構(gòu)建背景模型的 barcodes 的選燃矣佟:(1)低于一個 UMI 閾值 T 的所有 barcodes异剥,這個 T 需要足夠小,使其不會包含任何真細(xì)胞(注意此閾值 T 與 m/100 閾值的區(qū)別)絮重;(2)選取的 barcodes 數(shù)量要夠多冤寿,以滿足一個精確的背景模型計算。


具體的算法先計算了背景集所有 barcodes 中每個基因的 UMI 總數(shù)绿鸣,接著使用 Good-Turing smoothing 算法為所有的基因估算一個非零的概率(此算法的優(yōu)勢在于也可為那些沒有在背景集中被檢測到基因進(jìn)行估算疚沐,而這些基因可能會出現(xiàn)在真細(xì)胞的數(shù)據(jù)中),現(xiàn)在就得到了這個關(guān)于各個基因 UMI 計數(shù)的多項分布模型潮模。

b. 接著將在第一步驟中所有未被標(biāo)注為高質(zhì)量細(xì)胞的 barcodes 依次和背景模型相比較亮蛔,那些與背景模型存在顯著差異的細(xì)胞會被回收到高質(zhì)量細(xì)胞的行列。

具體的計算采用了 Monte Carlo 方法擎厢,在背景模型中進(jìn)行隨機(jī)抽樣究流,通過多次循環(huán)模擬計算得到某一 barcodes 計數(shù)的 p 值。

圖解實例

下圖是一群高 RNA 含量的 293T細(xì)胞和一群低 RNA 含量的 PBMC 細(xì)胞的混合樣本數(shù)據(jù)动遭》姨剑可以看到在被標(biāo)記為高質(zhì)量的部分出現(xiàn)了兩個群體(由第一個拐點A 大致分開),在第二個拐點 B 附近的區(qū)域同時包含空細(xì)胞和高質(zhì)量細(xì)胞厘惦,這部分細(xì)胞即為從第二步中回收出的細(xì)胞偷仿,圖片中顏色的深淺代表了局部高質(zhì)量細(xì)胞的比例。

圖片

所有被回收的高質(zhì)量細(xì)胞的矩陣宵蕉,會被輸出到 filtered_feature_bc_matrix 文件夾中酝静,根據(jù)矩陣信息進(jìn)行下游分析。以上就是 Cell Ranger 進(jìn)行細(xì)胞計數(shù)并回收的基本原理羡玛,你 get 了嗎别智?相對而言,本篇文章中的原理可能晦澀難懂了些稼稿,不完全理解也沒有關(guān)系薄榛。下篇文章讳窟,我們重點對 Cell Ranger 輸出的結(jié)果進(jìn)行解讀,相信一定能解開很多人的心頭困惑敞恋,敬請期待吧~

轉(zhuǎn)載:https://mp.weixin.qq.com/s/MGTLeoaRBUXRQTGvJ8mnLQ

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末丽啡,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子耳舅,更是在濱河造成了極大的恐慌碌上,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件浦徊,死亡現(xiàn)場離奇詭異,居然都是意外死亡天梧,警方通過查閱死者的電腦和手機(jī)盔性,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來呢岗,“玉大人冕香,你說我怎么就攤上這事『笤ィ” “怎么了悉尾?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長挫酿。 經(jīng)常有香客問我构眯,道長,這世上最難降的妖魔是什么早龟? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任惫霸,我火速辦了婚禮,結(jié)果婚禮上葱弟,老公的妹妹穿的比我還像新娘壹店。我一直安慰自己,他們只是感情好芝加,可當(dāng)我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布硅卢。 她就那樣靜靜地躺著,像睡著了一般藏杖。 火紅的嫁衣襯著肌膚如雪将塑。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天制市,我揣著相機(jī)與錄音抬旺,去河邊找鬼。 笑死祥楣,一個胖子當(dāng)著我的面吹牛开财,可吹牛的內(nèi)容都是我干的汉柒。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼责鳍,長吁一口氣:“原來是場噩夢啊……” “哼碾褂!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起历葛,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤正塌,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后恤溶,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體乓诽,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年咒程,在試婚紗的時候發(fā)現(xiàn)自己被綠了鸠天。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡帐姻,死狀恐怖稠集,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情饥瓷,我是刑警寧澤剥纷,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站呢铆,受9級特大地震影響晦鞋,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜刺洒,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一鳖宾、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧逆航,春花似錦鼎文、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至抹剩,卻和暖如春撑帖,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背澳眷。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工胡嘿, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人钳踊。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓衷敌,卻偏偏與公主長得像勿侯,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子缴罗,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容