10X單細(xì)胞(10X空間轉(zhuǎn)錄組)數(shù)據(jù)分析總結(jié)之各種NMF

hello奄毡,大家好商蕴,今天我們來初步總結(jié)一下所有單細(xì)胞分析用到的NMF。

我們先來簡(jiǎn)單回顧一下批次矯正的方法liger皆的。LIGER 是 19年發(fā)在 Cell 上的覆履,算是連著自己的 resource 發(fā)了自己的計(jì)算方法。 在我分享的文章中10X單細(xì)胞(空間轉(zhuǎn)錄組)數(shù)據(jù)整合分析批次矯正之liger中詳細(xì)分享了liger费薄,其中用到了iNMF硝全,我們這次也要詳細(xì)的講解。

圖片.png
其實(shí)liger批次矯正的核心思想是非負(fù)矩陣分解楞抡,希望兩個(gè) batch 的數(shù)據(jù)在分解中滿足一定性質(zhì)伟众,共享盡可能多的信息,并且認(rèn)為這部分共享的信息就是生物信息召廷。
兩個(gè) batch 的數(shù)據(jù)可以寫成如下形式凳厢,表達(dá)譜可分為 biological 信息和 technical 信息的加和账胧。
圖片.png

MNN 假設(shè)(關(guān)于MNN就不再贅述,網(wǎng)上說了很多了)

關(guān)于 MNN 在這個(gè)框架下的假設(shè)
B先紫、W正交治泥,也就是 Biology variance 和 batch effect 所代表的的方向相互正交。
|Bβ - Bγ| >> |Wxα - Wyζ|遮精, 即 不同 Cell 之間的生物差異遠(yuǎn)大于 Batch 之間的差異時(shí)居夹。
根據(jù)這兩個(gè)假設(shè),可以從上述的X = XBio + Xbatch 中推導(dǎo)出 MNN 的目標(biāo)函數(shù)本冲。(不包括校正那一步)

LIGER

接下來我們看 LIGER 的關(guān)鍵部分准脂,也就是兩個(gè)非負(fù)矩陣分解,但是在分解過程中不同 batch 之間共享一組 W (可以看成代表生物 module )檬洞,另外還有一部分代表 data specific 的technical module 來 model batch effect狸膏。
image
寫成數(shù)學(xué)表達(dá)式也就是
圖片.png
首先在這篇文章中 gene cell 的維度和之前說的是反過來的,如果順過來也就是
圖片.png
對(duì)比上文 MNN 中的式子
圖片.png
可以發(fā)現(xiàn)添怔,其實(shí) LIGER 中也就是 B = W湾戳、Wx = Vβ = α = H澎灸,然后這些矩陣均非負(fù)院塞。
此時(shí)再觀察 LIGER 的優(yōu)化目標(biāo)
圖片.png
可以看到還有一項(xiàng)是關(guān)于HiVi的懲罰,而HV其實(shí)是Ebatch性昭,這表示希望學(xué)到的Ebatch盡可能小拦止,反之即希望學(xué)到的EBio盡可能大,也就是保留盡量多的共享生物信息糜颠。
所以總結(jié)一下 LIGER 在之前模型上的假設(shè)

1汹族、B = WWx = V 其兴、β = α = H顶瞒,說明給定 biological module 和technical module 之后,這個(gè) loading 應(yīng)該是大家共享的元旬,也即說明兩者有一定的關(guān)系榴徐,可以由同一個(gè) factor loading 控制。

  1. HiVi盡可能小匀归,也就是說明希望這個(gè) embedding 能夠捕捉到的生物信息盡可能多坑资。
  2. WV穆端、H均非負(fù)袱贮,這部分其實(shí)是體現(xiàn) module 的味道,非負(fù)意味著完全由 加法得到体啰,也就是每個(gè)表達(dá)譜是由這些 module 的 activity 疊加得到的攒巍。

Summary

這些模型其實(shí)都是下述模型在不同假設(shè)情況下的特列
圖片.png

其實(shí)liger最核心的思想就是integrative non-negative matrix factorization (iNMF)嗽仪。

接下來我們就來分享各種NMF,其實(shí)關(guān)于NMF的分享柒莉,我已經(jīng)寫了很多闻坚,文章在10X單細(xì)胞(10X空間轉(zhuǎn)錄組)之NMF的實(shí)際運(yùn)用示例(探索腫瘤特征)10X單細(xì)胞(10X空間轉(zhuǎn)錄組)數(shù)據(jù)分析之約束非負(fù)矩陣分解(cNMF)等兢孝,供大家參考鲤氢。

首先是iNMF

我們來看 iNMF 中的目標(biāo)函數(shù)為:
圖片.png
其實(shí) LIGER 就是從 iNMF 中來的(上面講了),一模一樣西潘。 但是值得說明的是, iNMF 原文目的是為了多組學(xué)的數(shù)據(jù)哨颂,也就是同一個(gè) sample 測(cè)了多種組學(xué)喷市,但是 LIGER 將整合多組學(xué)的方法順延到了整合不同 batch 上(當(dāng)然其實(shí)也非常明顯,不同組學(xué)的區(qū)別就是 technology 不同威恼, single cell中的 batch effect 當(dāng)然也可以看做是這個(gè))品姓。

JNMF

而 iNMF 其實(shí)是建立在張老師 2009年這篇 JNMF 的基礎(chǔ)上的一個(gè)延伸,文章在A novel computational framework for simultaneous integration of multiple types of genomic data to identify microRNA-gene regulatory modules箫措,
我們來看兩者的目標(biāo)函數(shù)就可以非常清楚的看出這個(gè)延伸在哪腹备。
圖片.png
相比之下 JNMF 只考慮兩個(gè)數(shù)據(jù)集之間共享的部分信息,對(duì)于各自特有的沒有考慮斤蔓,而 iNMF 考慮了這部分異質(zhì)性的信息植酥,但在優(yōu)化的時(shí)候又對(duì)其做了約束,希望這個(gè)異質(zhì)性的信息盡可能的小弦牡,也就是共享的信息盡可能大友驮。(共享的信息其實(shí)是說在這個(gè) W 張成的 common space 能盡可能的重構(gòu)原來的表達(dá)譜)。

CSMF

Common and Specific patterns via Matrix Factorization 驾锰,顧名思義就同時(shí)考慮了共享的和異質(zhì)性兩部分卸留。 但是和 iNMF 最大的區(qū)別是,iNMF 假設(shè)了在 bio space(W張成)椭豫,以及 tech space(V 張成的空間)坐標(biāo)是相同的耻瑟,或者兩者是共享一套 factor loading 的。 CSMF 去掉了這個(gè)限制赏酥。但是同時(shí)也去掉了對(duì)于 specific 部分的懲罰喳整。 話不多說直接看目標(biāo)函數(shù)!
圖片.png
可以看到區(qū)別就是
圖片.png
也就是上文中說到的 iNMF 假設(shè)了在 bio space (W張成的空間)今缚,以及 tech space( V張成的空間)坐標(biāo)是相同的算柳,或者兩者是共享一套 factor loading 的。 而 CSMF 去掉了這個(gè)限制姓言。且同時(shí)在目標(biāo)函數(shù)中也去掉了對(duì)于 specific 部分的懲罰瞬项。(這個(gè)我感覺不是很合理其實(shí)蔗蹋,但是不知道是不是處于優(yōu)化的考慮)。

cFIT,關(guān)于cFIT囱淋,文獻(xiàn)在Integration and transfer learning of single-cell transcriptomes via cFIT,

cFIT 的核心如下圖
v2-23d166a1c5c730da59e57a0d3dff7333_720w.jpg
可以看到關(guān)鍵就是在于 cFIT 認(rèn)為
圖片.png
這是什么意思呢猪杭,其實(shí)就是認(rèn)為最后的 Xj都是由HjWT這個(gè)代表生物真實(shí)表達(dá)量通過一個(gè)線性變化得到的。其中Λ代表線性變換的 scale,bj表示一個(gè) offset妥衣。一句話總結(jié)皂吮, cFIT 認(rèn)為batch effect 的影響是一個(gè) gene specific 的 線性變換。E為 noise 乍一看 cFIT 和之前所述的分解為兩部分的 model 并沒有什么關(guān)系税手。 但是只要稍作變換就可以看出其實(shí)還是原始模型的變種蜂筹。
圖片.png
也就是說認(rèn)為 batch effect 帶來的表達(dá)譜Xbatch是線性于 XBio的。

summary

圖片.png
從上面幾個(gè)式子可以看出來最關(guān)鍵的部分就是怎么處理這個(gè)Xbatch芦倒。

生活很好艺挪,有你更好

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)通過簡(jiǎn)信或評(píng)論聯(lián)系作者兵扬。
  • 序言:七十年代末麻裳,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子器钟,更是在濱河造成了極大的恐慌津坑,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,324評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件傲霸,死亡現(xiàn)場(chǎng)離奇詭異疆瑰,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)昙啄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門乃摹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人跟衅,你說我怎么就攤上這事孵睬。” “怎么了伶跷?”我有些...
    開封第一講書人閱讀 162,328評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵掰读,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我叭莫,道長(zhǎng)蹈集,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,147評(píng)論 1 292
  • 正文 為了忘掉前任雇初,我火速辦了婚禮拢肆,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己郭怪,他們只是感情好支示,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鄙才,像睡著了一般颂鸿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上攒庵,一...
    開封第一講書人閱讀 51,115評(píng)論 1 296
  • 那天嘴纺,我揣著相機(jī)與錄音,去河邊找鬼浓冒。 笑死栽渴,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的稳懒。 我是一名探鬼主播熔萧,決...
    沈念sama閱讀 40,025評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼僚祷!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起贮缕,我...
    開封第一講書人閱讀 38,867評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤辙谜,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后感昼,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體装哆,經(jīng)...
    沈念sama閱讀 45,307評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評(píng)論 2 332
  • 正文 我和宋清朗相戀三年定嗓,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蜕琴。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,688評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡宵溅,死狀恐怖凌简,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情恃逻,我是刑警寧澤雏搂,帶...
    沈念sama閱讀 35,409評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站寇损,受9級(jí)特大地震影響凸郑,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜矛市,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評(píng)論 3 325
  • 文/蒙蒙 一芙沥、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦而昨、人聲如沸救氯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽径密。三九已至,卻和暖如春躺孝,著一層夾襖步出監(jiān)牢的瞬間享扔,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評(píng)論 1 268
  • 我被黑心中介騙來泰國打工植袍, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留惧眠,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,685評(píng)論 2 368
  • 正文 我出身青樓于个,卻偏偏與公主長(zhǎng)得像氛魁,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子厅篓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容