10X單細胞空間聯(lián)合分析之四----DSTG

今天我們來分享另外一個10X單細胞空間聯(lián)合分析的方法----DSTG（Deconvoluting Spatial Transcriptomics Data），我們在了解這個方法之前忆谓，先對一些基礎(chǔ)的知識進行了解倍谜。

基礎(chǔ)知識

graph convolutional networks (GCN叶撒，圖神經(jīng)網(wǎng)絡(luò))

了解這個概念之前垫毙，先要對CNN（Convolutional Neural Networks河咽，卷積神經(jīng)網(wǎng)絡(luò)），這個我在之前的文章中分享過舌界，大家可以參考文章10X空間轉(zhuǎn)錄組與卷積神經(jīng)網(wǎng)絡(luò)（CNNs）,大家可以去看一下掘譬，這里不再多做解釋了。
然后我們來看GCN呻拌，大家參考這篇文章深度學(xué)習(xí)新星 | 圖卷積神經(jīng)網(wǎng)絡(luò)（GCN）有多強大,不關(guān)心算法的可以跳過這部分葱轩。

知道了這個之后，我們來看文章DSTG: Deconvoluting Spatial Transcriptomics Data through Graph-based Artificial Intelligence藐握，該文章目前已發(fā)表靴拱，影響因11分（很高了，而且是中國人寫的）猾普。
文章讀懂并不難缨历，我們這里只關(guān)注重點牲剃。

In this work, we have developed a novel graph-based artificial intelligence model, Deconvoluting Spatial Transcriptomics data through Graph-based convolutional networks(DSTG), for reliable and accurate decomposition of cell mixtures in the spatially resolved transcriptomics data. Based on the well-characterized scRNA-seq dataset（需要定義好的單細胞數(shù)據(jù)）, DSTG is able to learn the precise composition of spatial transcriptomics data using semi-supervised graph convolutional network.（圖卷積網(wǎng)絡(luò)解卷積空間數(shù)據(jù)）蠢莺。

The performance of DSTG has been validated on synthetic ST data(合成數(shù)據(jù)的驗證), as well as on different experimental ST datasets with well-defined structures including mouse cortex layer, hippocampus tissue, and pancreatic tumor tissues（真實空間數(shù)據(jù)的驗證）坷牛。

首先來看第一點：原理

圖片.png

Our hypothesis is that the captured gene expression on a spot is contributed by a mixture of cells located on that spot.（這里需要注意，也就是說空間的spot是由幾個細胞的混合物）笤成，Our strategy is to use the scRNA-seqderived synthetic spatial transcriptomics data called “pseudo-ST”, to predict cell compositions in real-ST data through semi-supervised learning.（用單細胞數(shù)據(jù)隨機混合幾個細胞來“偽造”空間的數(shù)據(jù)评架，來預(yù)測真實的空間轉(zhuǎn)錄組數(shù)據(jù)）。
這個地方需要注意一個問題
如果說單細胞數(shù)據(jù)和空間數(shù)據(jù)不是完全匹配的炕泳，比如說單細胞數(shù)據(jù)缺少或者多了某種細胞類型，這樣的話上祈，預(yù)測的結(jié)果完全是有問題的培遵。
我們來看看步驟：
（1）DSTG constructs the synthetic pseudo-ST data from scRNA-seq data as the learning basis of our method（利用單細胞數(shù)據(jù)隨機幾個細胞的信息合成pseudo-ST data浙芙，這里就需要注意我們上面提到的細胞類型的問題）
（2）DSTG learns a link graph of spot mapping across the pseudo-ST data and real-ST data using shared nearest neighbors. The link graph captures the intrinsic topological similarity between spots and incorporate the pseudo-ST and real-ST data into the same graph for learning.（兩個數(shù)據(jù)之間找鄰居，類似于Seurat的findAnchor）籽腕。
（3）based on the link graph, semi-supervised GCN is used to learn a latent representation of both local graph structure and gene expression patterns that can explain the various cell compositions at spots（GCN尋找最佳的“組分”）
步驟設(shè)計的還是很嚴(yán)謹(jǐn)?shù)奈撕簦褪欠椒ㄉ闲枰芏嗟恼{(diào)整。
方法的advantages
（1）sensitive and efficient皇耗，since for each spot, only the features of similar spots (i.e., neighbor nodes) are used南窗。
（2）acquiring generalizable（可歸納的） knowledge about the association between gene expression patterns and cell compositions across spots in both pseudo- and real-ST, since the weight parameters in the convolution kernel are shared by all spots.
方法的缺點文獻沒有說，但是我們可以總結(jié)一下
（1）數(shù)據(jù)必須匹配
（2）“偽造”的空間數(shù)據(jù)郎楼，要考慮細胞內(nèi)部異型性的問題万伤，對于提取細胞類型的特征來代表這種細胞，其實是有一定的問題的呜袁。從這個角度看敌买，細胞越細分，對聯(lián)合分析越有利阶界，但是對單細胞數(shù)據(jù)分析就會要求很高虹钮。

接下來是一些實例驗證，當(dāng)然膘融，還是老套路芙粱，結(jié)果很好，不然發(fā)不出文章氧映。

圖片.png

接下來看一下軟件的算法：

首先看單細胞數(shù)據(jù)的分析方法

Variable gene selection
For the scRNA-seq data, we first identify genes that exhibit the most variability across different cell types using the analysis of variance (ANOVA). The top 2,000 most variable gene features in the scRNA-seq data are selected according to adjusted P values with Bonferroni correction. Using the scRNA-seq data of the top variable genes, we then generate the pseudo-ST data （這個地方注意宅倒，高變的前2000個基因“偽造”ST data）with synthetic mixtures of cells with known cell 。The gene expressions at each pseudospot of the pseudo-ST data is generated by combining the randomly selected 2 to 8 cells from the scRNA-seq data.compositions.（這個地方就需要注意了屯耸，一種細胞類型其實內(nèi)部也是有異質(zhì)性的拐迁，都是T細胞，高變基因的隨機組合結(jié)果也是千差萬別的）疗绣。For simplicity and illustration, we consistently use the term “spot” to represent the synthetic cell mixture of the pseudo-ST data as well as a spot or a bead of real-ST data线召。
Link graph
這個地方大家需要注意兩點：
（1）這種link的建立，算法在

圖片.png

（2）低維空間數(shù)據(jù)的分析Second, in the low dimension space, we identify the mutual nearest neighbors among spots from pseudo-ST and real-ST data多矮。
算法相對復(fù)雜缓淹，學(xué)數(shù)學(xué)的大牛可以出來解釋一下塔逃。

至于這個方法的代碼在DSTG,代碼就不帶著大家做一做了讯壶，關(guān)鍵在于自己理解這個軟件的用法，以及代碼的參數(shù)湾盗，封腳本很簡單伏蚊，大家自己動手做做就可以了。

生活很好格粪，有你更好

最后編輯于：2022.02.28 10:19:14

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

禁止轉(zhuǎn)載躏吊，如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者氛改。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市比伏，隨后出現(xiàn)的幾起案子胜卤，更是在濱河造成了極大的恐慌，老刑警劉巖赁项，帶你破解...
沈念sama閱讀 206,013評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件葛躏，死亡現(xiàn)場離奇詭異，居然都是意外死亡悠菜，警方通過查閱死者的電腦和手機舰攒，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,205評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來李剖，“玉大人芒率，你說我怎么就攤上這事「菟常” “怎么了偶芍？”我有些...
開封第一講書人閱讀 152,370評論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長德玫。經(jīng)常有香客問我匪蟀，道長，這世上最難降的妖魔是什么宰僧？我笑而不...
開封第一講書人閱讀 55,168評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任材彪，我火速辦了婚禮，結(jié)果婚禮上琴儿，老公的妹妹穿的比我還像新娘段化。我一直安慰自己，他們只是感情好造成，可當(dāng)我...
茶點故事閱讀 64,153評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布显熏。她就那樣靜靜地躺著，像睡著了一般晒屎。火紅的嫁衣襯著肌膚如雪喘蟆。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 48,954評論 1贊 283
城市分裂傳說
那天鼓鲁，我揣著相機與錄音蕴轨，去河邊找鬼。笑死骇吭，一個胖子當(dāng)著我的面吹牛橙弱，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 38,271評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼膘螟，長吁一口氣：“原來是場噩夢啊……” “哼成福！你這毒婦竟也來了碾局？” 一聲冷哼從身側(cè)響起荆残，我...
開封第一講書人閱讀 36,916評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎净当，沒想到半個月后内斯，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,382評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡像啼，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,877評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年俘闯，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片忽冻。...
茶點故事閱讀 37,989評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡真朗，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出僧诚，到底是詐尸還是另有隱情遮婶，我是刑警寧澤，帶...
沈念sama閱讀 33,624評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布湖笨，位于F島的核電站旗扑，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏慈省。R本人自食惡果不足惜臀防，卻給世界環(huán)境...
茶點故事閱讀 39,209評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望边败。院中可真熱鬧袱衷，春花似錦、人聲如沸笑窜。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,199評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽怖侦。三九已至篡悟，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間匾寝，已是汗流浹背搬葬。一陣腳步聲響...
開封第一講書人閱讀 31,418評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留艳悔，地道東北人急凰。一個月前我還...
沈念sama閱讀 45,401評論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親抡锈。傳聞我的和親對象是個殘疾皇子疾忍，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 42,700評論 2贊 345

10X單細胞空間聯(lián)合分析之四----DSTG

今天我們來分享另外一個10X單細胞空間聯(lián)合分析的方法----DSTG（Deconvoluting Spatial Transcriptomics Data），我們在了解這個方法之前忆谓，先對一些基礎(chǔ)的知識進行了解倍谜。

基礎(chǔ)知識

graph convolutional networks (GCN叶撒，圖神經(jīng)網(wǎng)絡(luò))

首先來看第一點：原理

首先看單細胞數(shù)據(jù)的分析方法

推薦閱讀更多精彩內(nèi)容