空間信息在空間轉(zhuǎn)錄組中的運(yùn)用

扇銮浚基圖在單細(xì)胞數(shù)據(jù)探索中的應(yīng)用
熱圖在單細(xì)胞數(shù)據(jù)分析中的應(yīng)用
定量免疫浸潤在單細(xì)胞研究中的應(yīng)用
Network在單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析中的應(yīng)用
你到底想要什么樣的umap/tsne圖?

空間分析目前已成為生命科學(xué)中發(fā)展最為迅速的領(lǐng)域之一公给,高通量測序的空間技術(shù)更是如火如荼,究其原因主要有三點(diǎn):

  • 生命科學(xué)家越來越認(rèn)識到空間結(jié)構(gòu)在基礎(chǔ)醫(yī)學(xué)以及臨床應(yīng)用中的重要性
  • 我們所能測到的圖譜(atlas/landscape/scenery)愈發(fā)多樣飒赃,需要對其空間異質(zhì)性進(jìn)行評價驮肉。
  • 大量空間分析技術(shù)和軟件的出現(xiàn)使得空間分析成為可能涣雕。

然而,當(dāng)拿到空間數(shù)據(jù)(如10 X Visium)的時候装处,沒有受到空間數(shù)據(jù)分析訓(xùn)練生物學(xué)家误债,往往不能很好地利用空間信息。最近的空間轉(zhuǎn)錄組的文章妄迁,大部分空間信息只是作為X-Y的畫板——在上面畫基因表達(dá)量或者分組信息寝蹈。空間信息的地位簡化到可視化工具TSNE和UMAP之列登淘,這不免令人惋惜箫老。

本文的目的就是力求解決目前生物學(xué)研究對空間分析的需求與許多生物學(xué)家不能正確進(jìn)行空間分析之間的矛盾。

首先黔州,我們需要明確的一個概念是“空間(Spatial)”耍鬓,這里討論的主要是一張二維(x-y)的圖象(image)×髌蓿空間技術(shù)離不開成像(imaging)技術(shù)牲蜀,但是空間含義區(qū)別于另外兩種用到成像的技術(shù):原位(situ) 和影像(Radiography)。更一般地绅这,我們討論的空間是一種坐標(biāo)系(coordinate)各薇,二維上即由X軸和Y軸構(gòu)成的平面。

進(jìn)一步縮小討論的范圍君躺,這里討論的空間峭判,是生物體內(nèi)組織細(xì)胞所處的位置(site/spot)。這雖然很像在生物體內(nèi)的地理學(xué)棕叫,但是到目前為止林螃,這個地理學(xué)還沒有一個坐標(biāo)系,如經(jīng)緯度俺泣。但是疗认,獲得細(xì)胞的位置這一事實(shí)完残,對生物信息的豐富至少提供了以下可能:

  • 可以在傳統(tǒng)的細(xì)胞分析中明確地納入空間信息。如聚類可以對應(yīng)到空間聚類(spatial clustering)
  • 空間相對位置可以作為一個控制條件横漏,來設(shè)計實(shí)驗(yàn)谨设。如研究不同暴露部位的差異
  • 空間信息可以直接地包括在對其他特征的分析過程中。如基因表達(dá)
  • 探索缎浇、描述和量化空間格局扎拣,以便通過生物學(xué)數(shù)據(jù)的空間信號對生物學(xué)過程有更為深入的理解
  • 在同一個空間中的多模態(tài)數(shù)據(jù)間建立聯(lián)系

那么空間信息意味著什么呢? 先看地理學(xué)家是如何看待空間信息的:

  • 地理學(xué)第一定律(Tobler's First Law): Everything is related to everything else, but near things are more related to each other. [1] (任何事物都是與其他事物相關(guān)的,只不過相近的事物關(guān)聯(lián)更緊密)
  • 地理學(xué)第二定律: 空間異質(zhì)性定律(Law of Spatial Heterogeneity), 即空間的隔離造成了地物之間的差異素跺,即異質(zhì)性二蓝,可分為空間局域異質(zhì)性和空間分層異質(zhì)性
  • 地理第三定律: 兩個點(diǎn)(區(qū)域)的地理 配置 (環(huán)境) 越相似,目標(biāo)變量在這兩個點(diǎn)(區(qū)域)的值(過程)越相似

這三條地理學(xué)定理對任何一張切片上的cell/spot位置是適用的嗎指厌?是適用的刊愚,這一點(diǎn)我們認(rèn)為是沒有疑義的。那么踩验,基于此我們單細(xì)胞數(shù)據(jù)科學(xué)家可以有什么新的啟發(fā)呢鸥诽?

先讓這個叫人心潮澎湃的問題冷卻一會吧。其實(shí)單細(xì)胞數(shù)據(jù)科學(xué)一直沒有離開空間(space)箕憾,甚至可以說有不少模型是在空間中進(jìn)行的牡借。如特征選擇的PCA空間,我們需要思考納入幾個維度厕九;可視化的時候我們會用TSNE/UMAP二維空間蓖捶;在分細(xì)胞亞群的時候用到的聚類(clustering)是在降維空間內(nèi)計算細(xì)胞間的距離(distance)地回;在做不同模態(tài)數(shù)據(jù)整合的時候可以用WNN(weighted-nearest neighbor)扁远,一看也是在某空間內(nèi)算對象的距離;在做逆時序分析時用到的最小生成樹(Minimum Spanning Tree,MST )刻像,也可以對應(yīng)到空間中對象之間的連接畅买。就拿可視化降維來說吧,雖然不是真實(shí)的空間细睡,但是基因的表達(dá)模式還是有人總結(jié)出:salt-and-pepper expression pattern [2] 反思之谷羞,在這個意義上,之前單細(xì)胞所有可以畫到UMAP上的信息溜徙,都可以畫到真實(shí)空間中湃缎。

如果納入了真實(shí)的空間信息,接受了地理學(xué)三大定律蠢壹,就可以用地理學(xué)的一整套詞匯來描述基因在空間中的表達(dá)模式了嗓违。如果還沒有接受地理學(xué)三大定律,做知識儲備或心理建設(shè)先图贸。

現(xiàn)在 蹂季,我們追問基于此我們單細(xì)胞數(shù)據(jù)科學(xué)家可以有什么新的啟發(fā)呢冕广?

回答是:之前的降維聚類以及各種推斷將會被重估。

我們知道降維聚類都是基于表達(dá)量來計算細(xì)胞之間的距離偿洁,而現(xiàn)在我們有了真實(shí)的空間撒汉。根據(jù)地理學(xué)第一定律,cell/spot是有空間自相關(guān)的(spatial autocorrelation)涕滋,離的近的對象相似性更高睬辐。那么,我們可以問:

  • 如何量化空間自相關(guān)何吝,描述空間依賴
  • 如何劃分區(qū)域并識別潛在的邊界(這回癌旁癌組織不就分開了嗎)
  • 更關(guān)鍵的是溉委,由于空間自相關(guān)的存在,傳統(tǒng)統(tǒng)計學(xué)的基本假設(shè)(正態(tài)性爱榕,獨(dú)立性瓣喊,等方差性)均受到挑戰(zhàn)。好在地理學(xué)家們?yōu)槲覀儨?zhǔn)備了空間統(tǒng)計學(xué)黔酥,等著我們?nèi)W(xué)習(xí)藻三。

地理學(xué)第二定律(空間異質(zhì)性定律)簡直就是空間轉(zhuǎn)錄組的活的靈魂,我們?yōu)槭裁匆隹臻g轉(zhuǎn)錄組啊跪者,誰還不是為了獲得細(xì)胞棵帽、基因表達(dá)的空間異質(zhì)性?如

  • 兩個基因在空間不同位置(鄰近渣玲,重疊逗概,分離)表達(dá)意味著什么
  • 一個基因集(通常意味著某個pathway或調(diào)控關(guān)系)在空間的表達(dá)模式與表型的相應(yīng)
  • A區(qū)域與B區(qū)域的差別與連通對應(yīng)基因表達(dá)模式
  • 空間中基因表達(dá)模式的格局與過程分析

地理第三定律大意是一個細(xì)胞的(狀態(tài))受其鄰居影響。腫瘤細(xì)胞與免疫細(xì)胞的相互作用往往受其位置關(guān)系調(diào)節(jié)忘衍,很多治療措施也是干預(yù)到細(xì)胞的逾苫,這個意義上,空間信息的加入肯定會進(jìn)一步深化我們對腫瘤微環(huán)境中細(xì)胞行為的理解枚钓。坦率地說铅搓,有了空間信息的腫瘤微環(huán)境才是正宗的腫瘤微環(huán)境。如細(xì)胞間通信這種帶有明顯空間特征的生物信息搀捷,肯定需要新的算法來重新評估星掰。

以上我們簡要幻想了地理學(xué)概念在空間轉(zhuǎn)錄組的應(yīng)用,或者說我們沐浴了一番地理學(xué)的陽光嫩舟,到大草原走一波氢烘,放飛了一波思想。現(xiàn)在我們回來吧家厌,看看spatial-based RNA 分析方法播玖。

  • spatial co-expression Network

在看空間分析中的疊加統(tǒng)計的時候,就想到如果不同區(qū)域內(nèi)有共有基因的表達(dá)像街,我們知道有不同的劃分方式黎棠,而基因又有很多晋渺。當(dāng)時就在書的空白處寫下了 【空間共表達(dá)網(wǎng)絡(luò) 】,可惜 這里 空白 的地方太小 脓斩,更多想法寫不下木西,只是在后面寫下一個問號。然后一Google還真能查到不少優(yōu)秀的大腦在構(gòu)建這個模型了随静,當(dāng)然也可以從里面看到地理學(xué)的影子八千。

  • spatial cell-cell interactions

在做scRNA的CCI的時候,我們都想知道細(xì)胞在空間中的交流是怎樣的燎猛,而不是僅僅依賴配受體的表達(dá)量恋捆。那么,現(xiàn)在是時候了重绷。最簡單是按照細(xì)胞之間距離在傳統(tǒng)的模型中加入一個距離權(quán)重沸停,把空間信息加入到推斷的過程中。

  • spatial variable gene

既然空間信息那么重要昭卓,不同區(qū)域的變異(差異的)基因也值得關(guān)注愤钾,特別是我們需要圈出特定的區(qū)域時,或者已經(jīng)標(biāo)記出特定區(qū)域時候醒。

SpatialDE
  • spatial variance component analysis

一個基因有空間異質(zhì)性(或特異性)能颁,那么一個基因集呢?我們知道基因集言下之意對應(yīng)著一個pathway或者一個調(diào)控關(guān)系啊倒淫。單變量擴(kuò)展到多變量上面也就從基因走到了pathway和調(diào)控層面伙菊。那么現(xiàn)有的基因富集方法,如何擴(kuò)展到空間轉(zhuǎn)錄中呢敌土?所謂的富集其實(shí)就是打分嘛镜硕,如何制定打分體系。

  • Pseudotimespace analysis

我們知道擬時序分析其實(shí)就是一種排序分析纯赎,只是傳統(tǒng)的擬時序是在降維后的空間中進(jìn)行的細(xì)胞排序(這種順序最后表現(xiàn)為擬時序)谦疾。在排序的過程中加入空間信息南蹂,重新估算的擬時序犬金,即可得到新的擬時空間上的次序(Pseudotimespace )。

  • Spatial multimode integration

隨著空間技術(shù)的發(fā)展六剥,同一個空間之內(nèi)不僅可以測表達(dá)量還有染色質(zhì)可及性等晚顷,如何在一個空間內(nèi)描述多模態(tài)數(shù)據(jù)?或者在多個空間內(nèi)刻畫圖譜疗疟?

這些都是比較有意思問題该默,感興趣可以把這些英語關(guān)鍵字放到瀏覽器里面,其實(shí)已經(jīng)有大牛在嘗試著解決他們了策彤。隨著思考的深入愈發(fā)感覺需要數(shù)學(xué)(模型)知識才能駕馭得了這萬水千山栓袖。所謂:由山以上五六里匣摘,有穴窈然,入之甚寒裹刮,問其深音榜,則其好游者不能窮也,謂之后洞捧弃。余與四人擁火以入赠叼,入之愈深,其進(jìn)愈難违霞,而其見愈奇嘴办。景觀自然是十分誘人的,但是买鸽,又來一個所謂:古人之觀于天地涧郊、山川、草木眼五、蟲魚底燎、鳥獸,往往有得弹砚,以其求思之深而無不在也双仍。夫夷以近,則游者眾桌吃;險以遠(yuǎn)朱沃,則至者少。而世之奇?zhèn)ッ┯铡⒐骞侄何铮浅V^,常在于險遠(yuǎn)瑟俭,而人之所罕至焉翎卓,故非有志者不能至也。

其實(shí)寫著寫著摆寄,空間上面可以承載的生物學(xué)問題果然很多啊失暴,要不要開始生理生態(tài)學(xué)。


https://asdar-book.org/
https://www.rspatial.org/raster/analysis/index.html
https://www.taylorfrancis.com/books/9781003021643
https://www.jeffdoser.com/files/for875/_book/sp.html
https://cran.r-project.org/web/views/Spatial.html
https://mgimond.github.io/Spatial/coordinate-systems-in-r.html
https://oscarperpinan.github.io/rastervis/
https://books.google.com/books/about/Quantative_Morphology.html?id=Aq78xAEACAAJ
https://stackoverflow.com/questions/61661388/converting-a-png-file-to-a-window-owin-file-in-spatstat
http://spatialgiotto.rc.fas.harvard.edu/documentation2.html
https://blog.csdn.net/Hui_R_Q_XIONGDA/article/details/104395989
https://rubd.github.io/Giotto_site/
https://zhuanlan.zhihu.com/p/283199848
https://andrewmaclachlan.github.io/CASA0005repo/index.html
http://www.reibang.com/p/18b8db1d2f64
https://stlearn.readthedocs.io/en/latest/index.html

Methods of counting discrete tissue components in microscopical sections
Identification of spatial expression trends in single-cell gene expression data
SpatialCPie: an R/Bioconductor package for spatial transcriptomics cluster evaluation
SpaGE: Spatial Gene Enhancement using scRNA-seq
SpatialDE: identification of spatially variable genes
[1] Wortley, R., and M. Townsley, eds… 2016. Environmental Criminology and Crime Analysis. Vol. 18. London: Taylor & Francis.
[2] Spatially and functionally distinct subclasses of breast cancer-associated fibroblasts revealed by single cell RNA sequencing
Dokuchaev, V. V. 1883/1948/1967. “Russian Chernozem.” In Selected Works of V. V. Dokuchaev, Moscow, 1948, 1, 14–419, (for USDA-NSF), Publ. by S. Monson, 1967. (Transl. into English by N. Kaner). Jerusalem: Israel Program for Scientific Translations.
Network Visualization and Analysis of Spatially Aware Gene Expression Data with InsituNet
Inferring the spatial code of cell-cell interactions and communication across a whole animal body
Modelling cell- cell interactions from spatial molecular data with spatial varian cecomponent analysis
Multimodal Analysis of Composition and Spatial Architecture in Human Squamous Cell Carcinoma
Inferring spatial and signaling relationships between cells from single cell transcriptomic data
Spatially Resolved Transcriptomes—Next Generation Tools for Tissue Exploration
Statistical Analysis of Spatial Expression Pattern for Spatially Resolved Transcriptomic Studies
空間分析——生態(tài)學(xué)家指南微饥,Mark Dale 等著逗扒,楊曉輝等譯
空間數(shù)據(jù)分析,蘇世亮等編著
空統(tǒng)計學(xué)欠橘,J·Diggle 著矩肩,吳良譯
R語言空間數(shù)據(jù)處理與分析實(shí)踐教程,盧賓賓編著
王安石||游褒禪山記

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末肃续,一起剝皮案震驚了整個濱河市黍檩,隨后出現(xiàn)的幾起案子叉袍,更是在濱河造成了極大的恐慌,老刑警劉巖刽酱,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件畦韭,死亡現(xiàn)場離奇詭異,居然都是意外死亡肛跌,警方通過查閱死者的電腦和手機(jī)艺配,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來衍慎,“玉大人转唉,你說我怎么就攤上這事∥壤Γ” “怎么了赠法?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長乔夯。 經(jīng)常有香客問我砖织,道長,這世上最難降的妖魔是什么末荐? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任侧纯,我火速辦了婚禮,結(jié)果婚禮上甲脏,老公的妹妹穿的比我還像新娘眶熬。我一直安慰自己,他們只是感情好块请,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布娜氏。 她就那樣靜靜地躺著,像睡著了一般墩新。 火紅的嫁衣襯著肌膚如雪贸弥。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天海渊,我揣著相機(jī)與錄音绵疲,去河邊找鬼。 笑死切省,一個胖子當(dāng)著我的面吹牛最岗,可吹牛的內(nèi)容都是我干的帕胆。 我是一名探鬼主播朝捆,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼懒豹!你這毒婦竟也來了芙盘?” 一聲冷哼從身側(cè)響起驯用,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎儒老,沒想到半個月后蝴乔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡驮樊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年薇正,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片囚衔。...
    茶點(diǎn)故事閱讀 38,100評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡挖腰,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出练湿,到底是詐尸還是另有隱情猴仑,我是刑警寧澤,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布肥哎,位于F島的核電站辽俗,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏篡诽。R本人自食惡果不足惜崖飘,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望杈女。 院中可真熱鬧坐漏,春花似錦、人聲如沸碧信。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽砰碴。三九已至躏筏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間呈枉,已是汗流浹背趁尼。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留猖辫,地道東北人酥泞。 一個月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像啃憎,于是被迫代替她去往敵國和親芝囤。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評論 2 345

推薦閱讀更多精彩內(nèi)容