作者术陶,追風(fēng)少年i
周五了,一周的收官之戰(zhàn)煤痕,馬上國(guó)慶了梧宫,希望大家有個(gè)好的假期,一切都會(huì)好起來(lái)摆碉,周星馳有一句臺(tái)詞塘匣,雖然我們都是路人甲乙丙丁,但是一樣是有生命巷帝,有靈魂的忌卤。
書接上文,空間多組學(xué)分析破譯膠質(zhì)母細(xì)胞瘤中的雙向腫瘤-宿主相互依賴性(空間微環(huán)境)楞泼,我們來(lái)進(jìn)行方法拾遺并復(fù)現(xiàn)驰徊。
這里我們主要關(guān)注空間轉(zhuǎn)錄組的分析,關(guān)于空間代謝和空間蛋白堕阔,仍然需要不斷的學(xué)習(xí)棍厂。
第一點(diǎn),空間CNV分析超陆。
-
CNA estimation
通過(guò)將基因與其染色體位置對(duì)齊并對(duì)相對(duì)表達(dá)值應(yīng)用移動(dòng)平均值來(lái)估計(jì)拷貝數(shù)變異 (CNV)牺弹,每個(gè)染色體內(nèi)有 100 個(gè)基因的滑動(dòng)窗口(跟inferCNV的原理一致),首先时呀,使用 InferCNV 包根據(jù)它們各自的基因組定位排列基因张漂。 作為非惡性細(xì)胞的參考集,使用了來(lái)自非惡性皮層樣本的空間轉(zhuǎn)錄組數(shù)據(jù)集(注意這里ref的選擇)谨娜。 為了提高速度和計(jì)算能力航攒,subsample是可選的。 為了避免任何特定基因?qū)σ苿?dòng)平均線的相當(dāng)大的影響趴梢,將相對(duì)表達(dá)值限制在 [-2.6,2.6] 的范圍內(nèi)漠畜,將所有高于/低于 exp(i) = |2.6| 的值替換為 exp(i) = |2.6|币他。然后重新導(dǎo)入導(dǎo)出的 .RDS 輸出文件,并按估計(jì)的 CNA 的染色體平均值進(jìn)行分組盆驹,并使用 SPATA 對(duì)象的 fdata slot與它們的空間位置對(duì)齊圆丹。使用 SPATA::joinWithFeatures() 函數(shù)滩愁,然后提取了集群比較躯喇。空間數(shù)據(jù)的 CNA 分析是通過(guò) SPATA2::runCnvAnalysis() 命令在 SPATA2 中實(shí)現(xiàn)的硝枉。在下一步中廉丽,估計(jì)的 CNA 值重新排列到定義的染色體bin中。這些 bin 由 SPATAwrappers 函數(shù) Create.ref.bins() 創(chuàng)建妻味,使用 SPATA 對(duì)象和給定 bin 的大小作為輸入正压。在本研究中,使用了 1Mbp 的 bin 大小责球,產(chǎn)生 3847 個(gè)染色體 bin焦履,每個(gè) bin 平均覆蓋 5.5 個(gè)基因。使用 10kbp 滑動(dòng)窗口進(jìn)行重新縮放和插值雏逾。對(duì)于標(biāo)準(zhǔn)化嘉裤,使用了一個(gè) loess 回歸模型,用于確定來(lái)自 InferCNV 輸出的拷貝數(shù)值栖博。使用 SPATAwrappers::run-CNV.Normalization() 函數(shù)進(jìn)行Interpolation和歸一化屑宠。
SPATA分析CNV的代碼如下
library(SPATA2)
spata_obj <- loadSpataObject("data/spata-obj-gbm275.RDS")###加載infercnv分析得到的rds
spata_obj <-
runCnvAnalysis(
object = spata_obj
directory_cnv_folder = "data-gmb275/cnv-results" # example directory
cnv_prefix = "Chr"
)
# change input
spata_obj <-
runCnvAnalysis(
object = spata_obj
directory_cnv_folder = "data-gmb275/cnv-results" # example directory to
clear_noise_via_ref_mean_sd = list(sd_amplifier = 2)
# example on how to use the functions arguments if you want to specify the reference (ref_*)
runCnvAnalysis(
object = spata_obj,
directory_cnv_folder = "data-gmb275/cnv-results", # example directory to
ref_annotation = cnv_ref$annotation,
ref_mtr = cnv_ref$mtr,
ref_regions = cnv_ref$regions
)
##CNV-Results
cnv_results <- getCnvResults(spata_obj)
names(cnv_results)
##Visualization
plotCnvResults(object = spata_obj)
plotSurface(object = spata_obj, color_by = "seurat_clusters")
plotCnvResults(object = spata_obj, across = "seurat_clusters")
###CNV-Heatmap
getCnvFeatureNames(object = spata_obj)
# are part of all feature names
getFeatureNames(object = spata_obj)
## numeric integer numeric numeric
## "nCount_Spatial" "nFeature_Spatial" "percent.mt" "percent.RB"
## factor character factor factor
## "seurat_clusters" "segmentation" "Leiden_UMAP" "cluster"
## logical numeric numeric numeric
## "keep" "Chr0" "Chr1" "Chr10"
## numeric numeric numeric numeric
## "Chr11" "Chr12" "Chr13" "Chr14"
## numeric numeric numeric numeric
## "Chr15" "Chr16" "Chr17" "Chr18"
## numeric numeric numeric numeric
## "Chr19" "Chr2" "Chr20" "Chr21"
## numeric numeric numeric numeric
## "Chr22" "Chr23" "Chr3" "Chr4"
## numeric numeric numeric numeric
## "Chr5" "Chr6" "Chr7" "Chr8"
## numeric
## "Chr9"
plotSurface(object = spata_obj, color_by = "Chr7", pt_clrsp = "Reds 3", c1 = 1)
plotSurface(object = spata_obj, color_by = "Chr10", pt_clrsp = "Blues 3", rev = FALSE, c1 = 1)
CNA subclone analysis
為了根據(jù) CNA 數(shù)據(jù)確定亞克隆,進(jìn)行了 PCA 分析仇让,然后對(duì)前 30 個(gè)組分進(jìn)行 KMeans 聚類(CNV得到的矩陣進(jìn)行分析)典奉。為了確定最優(yōu)的tree cut,我們估計(jì)了 Calinski-Harabasz 指數(shù)并使用了 k~CH 指數(shù)曲線的第一個(gè)峰值(CH 指數(shù) vs Number of clusters)丧叽。 下一個(gè)目標(biāo)是量化空間上不同的轉(zhuǎn)錄程序與亞克隆結(jié)構(gòu)的空間相關(guān)性和重疊卫玖。 首先,我們通過(guò)擬合值 (f(ck)) 估計(jì)給定 CNA 亞克隆的每個(gè)點(diǎn) (S1, S2;.; Sk) 到 KMeans 質(zhì)心 (c) 的距離 (Sdist)踊淳,如下所示:
從進(jìn)一步分析中去除了距離較近的點(diǎn)(Sdist < quantileSdist ;0.9)骇笔。 然后,估計(jì)了所有給定點(diǎn)的主要空間不同轉(zhuǎn)錄程序嚣崭,并量化了給定亞克隆中每個(gè)轉(zhuǎn)錄程序的表達(dá)百分比笨触。
第二部分
-
Prediction of tumor cell content
為單細(xì)胞測(cè)序研究建立的分析和算法不一定適用于空間分辨轉(zhuǎn)錄組數(shù)據(jù)的分析。 這主要是由于每個(gè)點(diǎn)內(nèi)的細(xì)胞組成不明確雹舀,分析這些數(shù)據(jù)的一個(gè)優(yōu)勢(shì)是近似每個(gè)點(diǎn)的真實(shí)組成芦劣。單細(xì)胞數(shù)據(jù)和空間轉(zhuǎn)錄組學(xué)的整合已經(jīng)可以預(yù)測(cè)某些細(xì)胞類型的空間豐度,但在腫瘤中说榆,由于樣本內(nèi)部和樣本之間存在巨大的異質(zhì)性虚吟,這種預(yù)測(cè)很困難寸认。 與高度可變的基因表達(dá)相比,染色體改變是評(píng)估每個(gè)點(diǎn)的腫瘤細(xì)胞含量的相當(dāng)穩(wěn)健和合適的參數(shù)串慰。 為了訓(xùn)練和驗(yàn)證預(yù)測(cè)模型偏塞,對(duì)同一供體進(jìn)行了單細(xì)胞測(cè)序和相應(yīng)的空間分辨轉(zhuǎn)錄組學(xué)。
推斷了 scRNA-seq 數(shù)據(jù)集的拷貝數(shù)變化邦鲫,并提取了腫瘤和非惡性細(xì)胞的特征灸叼,這些特征顯示出很大的相似性。
接下來(lái)庆捺,驗(yàn)證了從 RNA-seq 數(shù)據(jù)調(diào)用的推斷 CNA 反映 DNA 測(cè)序中檢測(cè)到的 CNA 的程度古今。 因此,使用了最近發(fā)表的 slide-RNA-seq 和 slide-DNA-seq 數(shù)據(jù)集滔以,并比較了兩種空間測(cè)序方法檢測(cè)到的 CNA捉腥。 兩種驗(yàn)證方法都表明,從空間轉(zhuǎn)錄組學(xué)中獲得的推斷 CNA 反映了使用 10X Visium 平臺(tái)獲得的空間分辨轉(zhuǎn)錄組學(xué)中的實(shí)際染色體增益和損失你画。
第三點(diǎn)抵碟,Spatial autocorrelation Moran’s I,關(guān)于這個(gè)內(nèi)容坏匪,用過(guò)monocle3的童鞋應(yīng)該很熟悉拟逮。
空間自相關(guān)使用 Moran 的 I 統(tǒng)計(jì)值根據(jù)特征位置和屬性值確定點(diǎn)與其鄰居的空間依賴性。 這允許評(píng)估定義的基因表達(dá)或特征是分組的剥槐、分布的還是隨機(jī)的唱歧。 如果 Z 值或 p 值表示統(tǒng)計(jì)顯著性,則 Moran's I 指數(shù)值為正表示有聚集趨勢(shì)粒竖,而 Moran's I 指數(shù)值為負(fù)表示有分散趨勢(shì)颅崩。 自相關(guān)定義為:
where N defines the number of spatial spots with the index x and y and the matrix of spatial weights as wxy. The feature is indicated by exp and the mean value of neighboring features. The spatial weights were defined as a distance matrix of the cartesian space.W is defined as the sum of all wxy.
最后來(lái)一張空間軌跡
生活很好,有你更好蕊苗,主要還是針對(duì)CNV的分析為主