相信做過腫瘤單細(xì)胞的小伙伴對這個分析并不陌生卿叽,如果多讀幾篇文獻(xiàn)庶骄,就能在CNS以及大子刊上面看到這個分析。
非負(fù)矩陣分解(Nonnegative Matrix Factorization,NMF)是在矩陣中所有元素均為非負(fù)數(shù)約束條件之下的矩陣分解方法义郑。
基本思想:給定一個非負(fù)矩陣V, NMF能夠找到一個非負(fù)矩陣W和一個非負(fù)矩陣H, 使得矩陣W和H的乘積近似等于矩陣V中的值喳坠。
放在我們單細(xì)胞轉(zhuǎn)錄組的場景下,就是需要將一個基因×細(xì)胞
的表達(dá)矩陣(V)脱茉,分解成基因×表達(dá)程序
(W)剪芥,與表達(dá)程序×細(xì)胞
(H)兩個矩陣的乘積。如下圖:
在基因×表達(dá)程序
矩陣中琴许,存放的是每個program中税肪,每個基因的權(quán)重,往往根據(jù)權(quán)重最大的前20/30個基因來確定該program的功能榜田。如果是多個樣本益兄,每一個樣本均進(jìn)行以上操作,整合所有樣本的基因×表達(dá)程序
矩陣箭券,還可以畫相關(guān)性熱圖净捅,也就是文獻(xiàn)中經(jīng)常出現(xiàn)的那個圖。
在表達(dá)程序×細(xì)胞
矩陣中邦鲫,存放的是每個細(xì)胞中灸叼,每個program的相對強(qiáng)弱/使用情況神汹。
接下來的內(nèi)容分為兩篇,本篇推文介紹一些文章中用NMF解析腫瘤細(xì)胞異質(zhì)性的例子古今,下一篇手把手演示一遍NMF分析及作圖(將在公眾號發(fā)布)屁魏。
1. 頭頸鱗癌
Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer
這一篇文獻(xiàn)發(fā)表于2017年,算是很早期的單細(xì)胞文章了捉腥,文章利用NMF得到了一個p-EMT表達(dá)程序氓拼,其可以作為淋巴結(jié)轉(zhuǎn)移、分級抵碟、病理特征的獨(dú)立預(yù)測因子桃漾。
上圖的B就是所有program的相關(guān)性聚類熱圖,一般會將功能相似且相關(guān)性高的多個program當(dāng)做一個meta program拟逮。A圖是某一個病人撬统,program對應(yīng)的基因的表達(dá)情況。
2. 鼻咽癌
Single-cell transcriptomic analysis defines the interplay between tumor cells, virus infection, and the microenvironment in nasopharyngeal carcinoma敦迄。
這一篇文章去年發(fā)表于Cell Research恋追,對鼻咽癌腫瘤微環(huán)境進(jìn)行了解析,同時用NMF在腫瘤細(xì)胞中鑒別出一個表示“免疫原性”的表達(dá)程序罚屋,進(jìn)而找出一類獨(dú)特的“上皮-免疫”雙重特征腫瘤細(xì)胞亞群苦囱。
上面兩篇文獻(xiàn)的主要發(fā)現(xiàn)和結(jié)論都是基于NMF的結(jié)果,可見NMF在解析腫瘤細(xì)胞異質(zhì)性領(lǐng)域的作用之大脾猛。當(dāng)然撕彤,NMF也能用于其他細(xì)胞類型的單細(xì)胞數(shù)據(jù)。
3. 新冠研究
Plasma from patients with bacterial sepsis or severe COVID-19 induces suppressive myeloid cell production from hematopoietic progenitors in vitro
研究者用NMF在單核細(xì)胞中鑒定出一種MS1表達(dá)程序猛拴,MS1 表達(dá)程序與細(xì)菌性敗血癥和 COVID-19 的疾病嚴(yán)重程度相關(guān)羹铅,高表達(dá)意味著疾病更嚴(yán)重。
因水平有限愉昆,有錯誤的地方睦裳,歡迎批評指正!