單細(xì)胞RNA-seq去除批次效應(yīng)

這是一篇2018年發(fā)表在NBT上的文章婚夫,講述的是兩套單細(xì)胞數(shù)據(jù)如何去除批次效應(yīng)


文章鏈接:
https://www.nature.com/articles/nbt.4091

前言

由于不同的實驗室焊夸,以及各個技術(shù)人員手法不同创葡,在測單細(xì)胞RNA-seq的時候往往會造成批次效應(yīng)空执,從而影響到細(xì)胞亞群的分類改备。
作者提出了基于高維表達(dá)空間中mutual nearest neighbors (MNNs)的檢測方法來進(jìn)行批處理校正。 作者提出來的方法并不依賴批次之間預(yù)定義或相等的種群組成矗积。而傳統(tǒng)的RNA-seq去除批次效應(yīng)往往依賴于廣義線性模型全肮,挖掘潛在的協(xié)變量(批次效應(yīng)因子),并將它去除棘捣。但是對于單細(xì)胞數(shù)據(jù)來說辜腺,由于單細(xì)胞的維數(shù)更高,數(shù)據(jù)量更龐大乍恐,并且像10X這樣的測序手段评疗,每個細(xì)胞的異質(zhì)性比較大,所以用廣義線性模型去除批次效應(yīng)并不理想茵烈。這里有傳送門:關(guān)于批次效應(yīng)的若干問題
在scRNA-seq研究中百匆,批次之間的種群組成通常不同。即使每批中存在相同的細(xì)胞類型呜投,數(shù)據(jù)集中每種細(xì)胞類型的豐度也會根據(jù)過程的細(xì)微差異(造成這種細(xì)微差異的原因可能是細(xì)胞培養(yǎng)或組織提取加匈,解離和分選)
作者提出了一種新的方法,該方法定義了批次之間最相似的相同類型細(xì)胞仑荐,根據(jù)批次之間這些最相似的細(xì)胞來消除生物學(xué)相關(guān)批次之間的差異
因此雕拼,作者提出了一種矯正scRNA-seq的算法:MNN

原理


首先,Batch 1Batch 2 是兩個批次的scRNA-seq粘招,而不同顏色表示不同的細(xì)胞類群(對應(yīng)顏色和字符啥寇,x 對應(yīng) x'y 對應(yīng) y')男图。

該算法的步驟為:

  1. 對數(shù)據(jù)進(jìn)行余弦歸一化


    其中式子中的 Yx 表示的是 cell x 的表達(dá)矩陣向量

  2. 對余弦歸一化后的數(shù)據(jù)計算細(xì)胞間的歐式距離(利用每個細(xì)胞的表達(dá)譜向量計算細(xì)胞間距離)

  3. 進(jìn)行鄰近處理


    此時示姿,軟件在兩個 Batch 之間找最鄰近的細(xì)胞類群,比方說 Batch 1 的 x'Batch 2 的 x 最鄰近逊笆,Batch 1 的 y'Batch 2 的 y 最鄰近
    作者將這些兩個 Batch 之間最鄰近的細(xì)胞類群解釋為盡管屬于不同批次但仍屬于相同細(xì)胞類型或狀態(tài)的細(xì)胞栈戳。
    也就是說,兩個 Batch 之間距離最近的兩個細(xì)胞類群难裆,作者仍然把它們看為是同一細(xì)胞類群(忽略批次效應(yīng)帶來的影響)

  4. 對細(xì)胞類群進(jìn)行批次矯正子檀,用高斯核函數(shù)計算兩個 Batch 之間距離最近的兩個細(xì)胞類群,因為作者仍然把它們看為是同一細(xì)胞類群乃戈,所以這兩個Batch 之間褂痰,距離最近的兩個細(xì)胞類群之間的距離即為批次效應(yīng)所帶來的影響

  1. Batch 2 的細(xì)胞統(tǒng)一減去這一批次效應(yīng)的差異距離,即可投射在 Batch 1 所在的平面內(nèi)症虑,這樣批次效應(yīng)就去除了

    如果有 Batch 3 缩歪,重復(fù)上述步驟即可

MNN算法的基本假設(shè)

我們對MNN對的使用涉及三個假設(shè):
(i). 兩個批次中至少存在一個細(xì)胞群在兩個批次中是同一細(xì)胞群
(ii). 批次效應(yīng)幾乎與生物學(xué)子空間正交
(iii). 批次效應(yīng)變化為比不同細(xì)胞類型之間的生物效應(yīng)差異要小得多

結(jié)果比較


作者比較了不去除批次效應(yīng)的數(shù)據(jù),以及利用MNN谍憔,limma和ComBat等軟件去除批次效應(yīng)的結(jié)果匪蝙,可以看到利用MNN去除批次效應(yīng)后主籍,細(xì)胞聚類更為密切

軟件運用

軟件在Github上有:https://github.com/MarioniLab/MNN2017
或者利用R包:batchelor也可以

library(batchelor)

result = mnnCorrect(A1,A2)
#A1,A2為兩個批次的單細(xì)胞表達(dá)矩陣
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市逛球,隨后出現(xiàn)的幾起案子千元,更是在濱河造成了極大的恐慌,老刑警劉巖颤绕,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件幸海,死亡現(xiàn)場離奇詭異,居然都是意外死亡奥务,警方通過查閱死者的電腦和手機(jī)物独,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來汗洒,“玉大人议纯,你說我怎么就攤上這事∫绨” “怎么了瞻凤?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長世杀。 經(jīng)常有香客問我阀参,道長,這世上最難降的妖魔是什么瞻坝? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任蛛壳,我火速辦了婚禮,結(jié)果婚禮上所刀,老公的妹妹穿的比我還像新娘衙荐。我一直安慰自己,他們只是感情好浮创,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布忧吟。 她就那樣靜靜地躺著,像睡著了一般斩披。 火紅的嫁衣襯著肌膚如雪溜族。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天垦沉,我揣著相機(jī)與錄音煌抒,去河邊找鬼。 笑死厕倍,一個胖子當(dāng)著我的面吹牛寡壮,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼诬像,長吁一口氣:“原來是場噩夢啊……” “哼屋群!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起坏挠,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎邪乍,沒想到半個月后降狠,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡庇楞,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年榜配,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吕晌。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡蛋褥,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出睛驳,到底是詐尸還是另有隱情烙心,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布乏沸,位于F島的核電站淫茵,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蹬跃。R本人自食惡果不足惜匙瘪,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蝶缀。 院中可真熱鬧丹喻,春花似錦、人聲如沸翁都。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽荐吵。三九已至骑冗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間先煎,已是汗流浹背贼涩。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留薯蝎,地道東北人遥倦。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親袒哥。 傳聞我的和親對象是個殘疾皇子缩筛,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345