前沿綜述 | 如何從空間轉(zhuǎn)錄組數(shù)據(jù)中分析空間變異基因?

空間轉(zhuǎn)錄組研究中的一項關(guān)鍵任務(wù)是識別跨空間位置具有不同空間表達(dá)模式的空間變異基因(SVG)为居。識別SVG為系統(tǒng)分析特定位置的細(xì)胞狀態(tài)、推斷細(xì)胞間的通訊以及確定生物體中重要的表型和功能提供了機(jī)會杀狡。此前《Molecular Therapy-Nucleic Acids》發(fā)表綜述文章蒙畴,對目前可用于SVG分析的最先進(jìn)的計算方法和工具進(jìn)行了最新的系統(tǒng)性概述。該研究將指導(dǎo)醫(yī)學(xué)和生命科學(xué)家尋找專用資源和更有效的工具來表征基因表達(dá)的空間模式。


空間轉(zhuǎn)錄組的數(shù)據(jù)存儲庫

空間轉(zhuǎn)錄組的資源和數(shù)據(jù)庫概述?

?

SpatialDB(https://www.spatialomics.org/SpatialDB/):是一個手動管理的空間轉(zhuǎn)錄組資源膳凝,供研究人員有效研究和重復(fù)使用已發(fā)布的數(shù)據(jù)碑隆。當(dāng)前版本的SpatialDB包括5個物種(人類、小鼠蹬音、果蠅上煤、秀麗隱桿線蟲和斑馬魚)的24個空間轉(zhuǎn)錄組數(shù)據(jù)集。此外著淆,SpatialDB展示了SpatialDE和trendsceek識別的SVG劫狠,以及數(shù)據(jù)可視化、比較永部、GO和KEEG富集分析独泞。

Single Cell Portal (https://singlecell.broadinstitute.org/single_cell):是一個不斷發(fā)展的綜合性單細(xì)胞數(shù)據(jù)庫府适,該數(shù)據(jù)庫收集并整合了來自400項研究(包括空間轉(zhuǎn)錄組的研究和數(shù)據(jù)集)的17640076個細(xì)胞勃黍;其中大部分來自Broad研究所開發(fā)的空間轉(zhuǎn)錄組技術(shù)。


SVG識別的計算方法

在過去的幾年里抽活,已經(jīng)開發(fā)了許多計算方法/工具來幫助闡明基因表達(dá)的空間變異组橄。根據(jù)內(nèi)在原理可分為三類:(1)基于統(tǒng)計建模的方法荞膘;(2) 基于機(jī)器學(xué)習(xí)的方法;(3)基于空間網(wǎng)格的方法玉工。

SVG識別的計算工具和方法綜述?


基于統(tǒng)計建模的方法

基于統(tǒng)計建模方法的工作流程示意圖


基于已知細(xì)胞空間坐標(biāo)及其基因表達(dá)水平的統(tǒng)計建模方法為闡明空間基因表達(dá)異質(zhì)性提供了統(tǒng)計框架羽资。其一般工作流程:首先,輸入基因表達(dá)譜和細(xì)胞位置信息瓮栗。根據(jù)輸入的信息削罩,構(gòu)建統(tǒng)計框架來闡明基因表達(dá)值與細(xì)胞空間位置之間的相關(guān)性。隨后费奸,通過不同的統(tǒng)計方法確定顯著SVG弥激。

trendsceek使用標(biāo)記點過程來模擬基因表達(dá)和細(xì)胞坐標(biāo)之間的關(guān)聯(lián);SpatialDE是一種基于高斯過程回歸的方法愿阐;與SpatialDE相比微服,SPARK做了一些具體的改進(jìn),其基于具有多個空間核的空間廣義線性混合模型識別SVG缨历,直接對空間計數(shù)數(shù)據(jù)建模以蕴;SPARK-X基于非參數(shù)建模,有效地減少了內(nèi)存需求和計算時間辛孵,同時保持了可靠模型的有效性丛肮;GPcounts利用高斯過程回歸方法,通過負(fù)二項似然模型對空間轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行建模魄缚,在處理計數(shù)數(shù)據(jù)時實現(xiàn)了比高斯似然函數(shù)更好的擬合宝与;BayesSpace是一種完全貝葉斯統(tǒng)計方法焚廊,它使用來自空間鄰域的信息來增強(qiáng)空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進(jìn)行聚類分析。


基于機(jī)器學(xué)習(xí)的方法

基于機(jī)器學(xué)習(xí)策略的工作流程示意圖


基于光譜的方法已經(jīng)成為一種根據(jù)特征和基礎(chǔ)結(jié)構(gòu)之間一致性程度進(jìn)行無監(jiān)督特征選擇的方式习劫。

RayleighSelection擴(kuò)展了基于圖的Laplacian方法咆瘟,使用了一個簡單的復(fù)合體,顯著簡化了數(shù)據(jù)之間的關(guān)聯(lián)诽里,并對具有復(fù)雜組合結(jié)構(gòu)的特征進(jìn)行了特征選擇袒餐。

由于輸入數(shù)據(jù)的特征豐富且結(jié)構(gòu)良好,神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)的另一個重要分支谤狡,已被廣泛用于分析scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)灸眼。

SOMDE使用自組織映射(SOM),在保持原始空間信息的前提下豌汇,根據(jù)輸入數(shù)據(jù)的密度和拓?fù)浣Y(jié)構(gòu)構(gòu)造一個節(jié)點數(shù)較少的壓縮映射幢炸,然后用高斯過程(GP)檢測SVG;SPADE使用成像數(shù)據(jù)和空間轉(zhuǎn)錄組數(shù)據(jù)作為輸入拒贱,通過卷積神經(jīng)網(wǎng)絡(luò)提取每個點周圍的形態(tài)特征宛徊,并將其與基因表達(dá)數(shù)據(jù)相結(jié)合,以識別與空間和形態(tài)異質(zhì)性相關(guān)的關(guān)鍵基因逻澳。此外闸天,可以基于這些關(guān)鍵基因進(jìn)行功能分析,以進(jìn)一步闡明負(fù)責(zé)不同形態(tài)特征的生物過程斜做。


基于空間網(wǎng)格的方法

基于空間網(wǎng)格方法的工作流程示意圖


這類方法旨在將空間劃分為多個網(wǎng)格苞氮,并對不同細(xì)胞之間的空間關(guān)系進(jìn)行編碼或推斷細(xì)胞的分布,然后應(yīng)用后續(xù)步驟瓤逼,例如對細(xì)胞的空間相鄰關(guān)系或基因表達(dá)水平進(jìn)行二值化以識別SVG笼吟。

SingleCellHaystack將空間劃分為網(wǎng)格,并根據(jù)細(xì)胞的密度確定該網(wǎng)格上的多個網(wǎng)格點霸旗。對于每個基因贷帮,SingleCellHaystack通過閾值將所有細(xì)胞聚成兩類(檢測到該基因的細(xì)胞和未檢測到該基因的細(xì)胞)。然后诱告,SingleCellHaystack計算這兩類細(xì)胞的分布撵枢,并將它們與空間中細(xì)胞的隨機(jī)分布進(jìn)行比較。Kullback-Leibler散度用于計算每個基因的DKL分?jǐn)?shù)作為變異程度精居,并識別在多維空間中不均勻表達(dá)的基因锄禽。基于這個分?jǐn)?shù)靴姿,可以評估基因的空間變異性沃但。Merungue通過三角剖分算法(Delaunay)將空間轉(zhuǎn)錄組數(shù)據(jù)中的每個細(xì)胞視為一個鄰域,然后根據(jù)這些鄰域確定每個細(xì)胞對是否相鄰佛吓,并應(yīng)用二進(jìn)制鄰接權(quán)重矩陣來表示這種關(guān)系宵晚。根據(jù)構(gòu)建的鄰接矩陣和基因表達(dá)矩陣恨旱,Merungue計算出空間自相關(guān)統(tǒng)計量,即Moran's I坝疼,以獲得重要的空間基因。此外谆沃,Merungue通過空間交叉相關(guān)指數(shù)钝凶,將確定的空間基因分類為多種空間表達(dá)模式。Giotto已被開發(fā)為分析和可視化空間轉(zhuǎn)錄組數(shù)據(jù)的工具箱唁影,并結(jié)合了四種識別空間基因的方法耕陷,包括trendsceek、SpatialDE据沈、SPARK和BinSpect哟沫。BinSpect首先使用Delaunay創(chuàng)建一個空間網(wǎng)格來表示細(xì)胞之間的關(guān)聯(lián)。對于每個被輸入的基因锌介,BinSpect將通過K-means聚類或等級閾值對基因表達(dá)值進(jìn)行二值化嗜诀,并根據(jù)這些二值化的表達(dá)值計算出相鄰細(xì)胞之間的或然率表。通過統(tǒng)計學(xué)上的富集測試孔祸,如果一個基因在相鄰細(xì)胞中的表達(dá)量很高隆敢,這個基因?qū)⒈灰暈镾VG。作為一種基于圖的模型崔慧,隱馬爾科夫隨機(jī)場模型(HMRFs)利用空間基因和空間鄰域網(wǎng)絡(luò)來總結(jié)主要的空間域拂蝎。


首發(fā)公號:國家基因庫大數(shù)據(jù)平臺

參考文獻(xiàn)

Li K, Yan C, Li C, et al. Computational elucidation of spatial gene expression variation from spatially resolved transcriptomics data[J]. Molecular Therapy-Nucleic Acids, 2021.

圖片均來源于參考文獻(xiàn),如有侵權(quán)請聯(lián)系刪除惶室。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末温自,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子皇钞,更是在濱河造成了極大的恐慌悼泌,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鹅士,死亡現(xiàn)場離奇詭異券躁,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)掉盅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進(jìn)店門也拜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人趾痘,你說我怎么就攤上這事慢哈。” “怎么了永票?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵卵贱,是天一觀的道長滥沫。 經(jīng)常有香客問我,道長键俱,這世上最難降的妖魔是什么兰绣? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮编振,結(jié)果婚禮上缀辩,老公的妹妹穿的比我還像新娘。我一直安慰自己踪央,他們只是感情好臀玄,可當(dāng)我...
    茶點故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著畅蹂,像睡著了一般健无。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上液斜,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天累贤,我揣著相機(jī)與錄音,去河邊找鬼旗唁。 笑死畦浓,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的检疫。 我是一名探鬼主播讶请,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼屎媳!你這毒婦竟也來了夺溢?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤烛谊,失蹤者是張志新(化名)和其女友劉穎风响,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體丹禀,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡状勤,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了双泪。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片持搜。...
    茶點故事閱讀 40,110評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖焙矛,靈堂內(nèi)的尸體忽然破棺而出葫盼,到底是詐尸還是另有隱情,我是刑警寧澤村斟,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布贫导,位于F島的核電站抛猫,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏孩灯。R本人自食惡果不足惜闺金,卻給世界環(huán)境...
    茶點故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望峰档。 院中可真熱鬧掖看,春花似錦、人聲如沸面哥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽尚卫。三九已至,卻和暖如春尸红,著一層夾襖步出監(jiān)牢的瞬間吱涉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工外里, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留怎爵,地道東北人。 一個月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓盅蝗,卻偏偏與公主長得像鳖链,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子墩莫,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,047評論 2 355

推薦閱讀更多精彩內(nèi)容