MIA,多模態(tài)數(shù)據(jù)取交集方法,是針對Spot Cluster 水平上利用單細(xì)胞注釋信息來對ST-Spot聚類結(jié)果進(jìn)行細(xì)胞類型注釋湃累。
給定單細(xì)胞某個(gè)已知細(xì)胞類型和某個(gè)Spot的聚類編號,我們分別篩選各自的CellMarkers和SpotMarkers
Background定義為單細(xì)胞與ST數(shù)據(jù)共同表達(dá)的基因集,根據(jù)單細(xì)胞的CellMarkers可以將背景基因集分成兩塊區(qū)域媳拴,藍(lán)色和黃色部分
然后將ST的SpotMarkers分別與這兩個(gè)區(qū)域取交集
如果這個(gè)ST的SpotMarkers是隨機(jī)抽取的,那么落在這兩個(gè)區(qū)域的基因數(shù)應(yīng)該是符合一定的比例兆览, 如果出現(xiàn)過度集中與藍(lán)色區(qū)域屈溉,則我們認(rèn)為CellMarkers與SpotMarkers是顯著重疊的,那么我們可以得到這個(gè)SpotCluster屬于這個(gè)細(xì)胞類型的可能性越高拓颓。
其實(shí)這個(gè)就是超幾何分布模型语婴,我們可以一個(gè)公式來計(jì)算顯著性P值,由于P值是0-1之間驶睦,很小的數(shù)堤结,我們可以取-log10骇笔,轉(zhuǎn)換為得分,此得分越高,注釋與這個(gè)細(xì)胞類型的可能性就越高反砌。
很簡單,我們可以在R中的基本函數(shù)phyper中實(shí)現(xiàn)费奸,命令用黑色方框顯示。
i表示同時(shí)屬于scRNA的CellMarkers和ST的SpotMarkers
M表示scRNA的CellMarkers
大N表示scRNA和ST同時(shí)表達(dá)基因
小n表示ST的SpotMarkers
在這里我想說個(gè)題外話憋他,這個(gè)模型簡單且非常實(shí)用, 在基因功能富積分析使用的模型就是這個(gè)髓削,所以課后不妨大家多多了解下
最終我們得到SpotCluster的細(xì)胞類型預(yù)測結(jié)果文件竹挡,行為Cluster編號,其中括號內(nèi)的數(shù)字表示ST的SpotMarker數(shù)立膛,列為細(xì)胞類型
如果得分越高揪罕,這個(gè)SpotCluster屬于這個(gè)細(xì)胞類型的可能性就越高,我們可以看到Cluster3屬于Oligo的得分最高宝泵,因此屬于這個(gè)細(xì)胞類型的可能性就最高好啰。
我們可以將上面的表格進(jìn)行熱圖展示,行為Cluster儿奶,列為細(xì)胞類型框往,對細(xì)胞類型做了層級聚類
我們可以看到紅色方框內(nèi)是Cluster3對應(yīng)的Oligo細(xì)胞類型的數(shù)值,由于此值在Cluster3對應(yīng)的所有細(xì)胞類型最高闯捎,因此此Cluster被預(yù)測為Oligo細(xì)胞類型
我們也可以用梢祝基圖展示Cluster與已知細(xì)胞類型對應(yīng)關(guān)系,比如Cluster3沿著這個(gè)弧線對應(yīng)到Oligo細(xì)胞類型隙券。