(1)40 個(gè)組蛋白乙跏ㄍ龋化相關(guān)調(diào)節(jié)劑:PMID:?35252174
(2)97 個(gè)基因的入侵相關(guān)基因集:PMID:?35292033
(3)HGSOC的定量蛋白質(zhì)組數(shù)據(jù)和臨床信息來自CPTAC數(shù)據(jù)門戶(https://cptac-data-portal.georgetown.edu/studies/filters/primary_site:Ovary)
(4)從 NCBI-Gene 和 MSigDB 數(shù)據(jù)庫中檢索到的 1,960 個(gè) ARG 列表襟交,關(guān)鍵字為“血管生成”宙彪。
使用R包“ggpubr”分析ARG風(fēng)險(xiǎn)評分與突變負(fù)荷趣倾、同源重組缺陷(HRD)、新抗原負(fù)荷和染色體不穩(wěn)定性痹束、干性指數(shù)(mRNAsi)等各項(xiàng)指標(biāo)之間的相關(guān)性宇色。
突變負(fù)荷是使用 R 包“maftools”計(jì)算的。同源重組缺陷(HRD)和新抗原負(fù)荷和染色體不穩(wěn)定性的數(shù)據(jù)來自文章的附錄(PMID:29617664)施禾。
使用來自 Tathiane M.Malta 的評估算法基于表達(dá)譜評估干性指數(shù) (mRNAsi)脚线。然后,通過CIBERSORT 算法 (?https://cibersort.stanford.edu/?) 分析 Xene-OC 樣本中 22 個(gè)腫瘤浸潤免疫細(xì)胞 (TIIC) 的比例)
國際癌癥基因組聯(lián)盟 (ICGC) 數(shù)據(jù)門戶 (?https://icgc.org/ ) 的另一個(gè) OC 數(shù)據(jù)集)作為外部驗(yàn)證數(shù)據(jù)庫獲得弥搞,包括111個(gè)腫瘤樣本邮绿。
(6)訓(xùn)練集合并多個(gè)數(shù)據(jù)集的原因解釋:PMID:?35057823
(7)以每千堿基的片段數(shù) (FPKM) 為單位的 RNA-seq 譜被處理成每百萬個(gè) log2 轉(zhuǎn)換的轉(zhuǎn)錄本 (TPM)。PMID:?35281472
countToTpm<-function(counts,effLen)
{
rate<-log(counts)-log(effLen)
denom<-log(sum(exp(rate)))exp(rate-denom+log(1e6))
}
countToFpkm<-function(counts,effLen)
{
N<-sum(counts)exp(log(counts)+log(1e9)-log(effLen)-log(N))
}
fpkmToTpm<-function(fpkm)
{
exp(log(fpkm)-log(sum(fpkm))+log(1e6))
}
tpms<-apply(expMatrix,2,fpkmToTpm)? ##FPKM值轉(zhuǎn)換成TPM值
countToEffCounts<-function(counts,len,effLen)
{
counts*(len/effLen)
}
從分子特征數(shù)據(jù)庫(MSigDB攀例,http?://www.gsea-msigdb.org/gsea/msigdb/)下載了總共 636 個(gè)糖基化相關(guān)(GR)基因
最佳截止閾值:中值船逮;由“survminer”包確定
res.cut <- surv_cutpoint(Sur_train, #數(shù)據(jù)集
? ? ? ? ? ? ? ? ? ? ? ? time = "OS.time",#生存時(shí)間
? ? ? ? ? ? ? ? ? ? ? ? event = "OS",#生存狀態(tài)
? ? ? ? ? ? ? ? ? ? ? ? variables = c("riskScore"))#需要計(jì)算的連續(xù)型數(shù)據(jù)列名
summary(res.cut)#查看數(shù)據(jù)最佳截?cái)帱c(diǎn)及統(tǒng)計(jì)量
(8)卵巢癌干細(xì)胞具有獨(dú)特的遺傳特征,使它們能夠復(fù)制原始腫瘤通過化療增殖并促進(jìn)復(fù)發(fā)的能力粤铭。卵巢癌的異質(zhì)性與腫瘤干細(xì)胞密切相關(guān)挖胃。干性標(biāo)記和生存-相關(guān)標(biāo)志物,探索卵巢癌干細(xì)胞群梆惯,并提供潛在的治療建議酱鸭。PMID:?35360863
2.2 分析卵巢癌 mRNAsi
OCLR 方法用于計(jì)算每個(gè)樣本的 mRNAsi,并結(jié)合 UCSC Xena 中的大量 RNA-Seq 樣本垛吗。分析mRNAsi與各種臨床特征之間的關(guān)系凹髓,得到干性相關(guān)低存活樣本,用于獲取干性相關(guān)關(guān)鍵基因中的干性相關(guān)關(guān)鍵基因怯屉。
2.2.1 計(jì)算卵巢癌的mRNAsi
對于卵巢癌樣本的mRNAsi蔚舀,使用一類線性回歸(OCLR)算法結(jié)合祖細(xì)胞生物學(xué)聯(lián)盟(PCBC)(https://www.synapse.org)提供的人類干細(xì)胞數(shù)據(jù)進(jìn)行訓(xùn)練,然后量化我們卵巢癌樣本的 mRNAsi(圖 1B)锨络。用mRNAsi(0-1)評價(jià)卵巢癌細(xì)胞的mRNAsi赌躺,值越接近1,癌細(xì)胞的干性越強(qiáng)足删。
(9)訓(xùn)練集選擇好后一定要先觀察Label信息寿谴,篩選一定量的樣本,TCGA樣本可借助(sangerbox)失受。驗(yàn)證集可以平臺(tái)為單位讶泰,整理這個(gè)平臺(tái)所有數(shù)據(jù)集合并咏瑟,增加樣本量,結(jié)果也更可靠痪署。PMID:?30594555码泞、PMID:?33680950