第1篇
原文:Integrative analysis of gene expression and DNA methylation through one‐class logistic regression machine learning identifies stemness features in medulloblastoma
解讀:“腫瘤干細胞”用生信怎么玩
1-干性指數(shù)的計算:源于一篇Cell文獻(必讀)扣唱。
2-連續(xù)性變量的界值選取:還可以使用‘cutp’ function of the R package ‘survMisc’ (https://cran.r-project.org/web/packages/survMisc) with default parameters.
訓練集和驗證集的劃分,還可以使用‘createDataPartition’ function of the R package ‘caret’ (https://cran.r-project.org/web/packages/caret)【雖然我一般使用人工劃分的方式】
3-干性指數(shù)與臨床分型的相關(guān)分析比較簡單冗疮,兩種干性指數(shù)與預后的分析(單因素诅挑、多因素)兜畸。本文預后分析發(fā)現(xiàn)努释,僅SHH型的預后與干性有關(guān),此后的分析都是局限于SHH型中咬摇。
4-根據(jù)干性指數(shù)的高低進行分組伐蒂,然后篩選DEG,在這些DEG里再尋找與預后有關(guān)的基因肛鹏,然后再使用Cox-LASSO降維得到最終的23基因逸邦。這一步的邏輯有點奇怪恩沛,篩選到的基因,可以解釋為:既與預后有關(guān)缕减,也與干性相關(guān)的基因雷客。
得到的23基因預后模型,再使用R包的選取界值方法桥狡,分成高危組和低危組搅裙,得到生存曲線的對比。
5-干性與免疫微環(huán)境的相關(guān)性分析:這個圖可以借鑒裹芝。
6-CMap分析來識別新的靶向特征的候選藥物部逮。
這篇文獻只讀了個大體思路和實現(xiàn)流程,但是沒有仔細分析思路的合理性嫂易、連貫性等細節(jié)(好的研究應(yīng)該是一環(huán)扣一環(huán))兄朋。有時間回來再辯證讀讀。