Nat Commun&JAMA INTERN MED|淺析兩篇LASSO+Logistic/Cox 套路文章
兩篇文章分別是來自NATURE COMMUNICATIONS
的Early triage of critically ill COVID-19 patients using deep learning
(https://doi.org/10.1038/s41467-020-17280-8)和 JAMA Internal Medicine
的Development and Validation of a Clinical Risk Score to Predict the Occurrence of Critical Illness in Hospitalized Patients With COVID-19
( doi:10.1001/jamainternmed.2020.2033).
22
LASSO+Logistic
第一篇為制定COVID-19住院患者發(fā)生危重疾病的臨床風險評分并驗證专筷。
LASSO篩選重要預測指標
入院時測量的72個指標锤躁,經(jīng)過LASSO回歸選擇榨咐,19個變量仍然是危重疾病的重要預測因子搬味。
Logistic模型構(gòu)建并驗證
通過邏輯回歸模型對19個變量進行再分析后棍厂,得出10個變量為重癥疾病的獨立預測因子聘惦。
- 訓練集驗證遮婶。
- 獨立隊列驗證锦援。
LASSO+Cox
第二篇為深度學習在新冠肺炎危重患者早期分診中的應用猛蔽。
LASSO篩選重要預測指標
入院時測量的74個指標,經(jīng)過LASSO回歸選擇灵寺,確定了10個具有統(tǒng)計學意義(P<0.05)的特征曼库。
Cox模型的建立與驗證
這里作者使用了基于深度學習的生存分析 Cox 算法對這 10 項指標進行建模。相比于傳統(tǒng)經(jīng)典方法略板,深度學習的優(yōu)勢是可通過神經(jīng)網(wǎng)絡對特征進行高階非線性組合毁枯,從而更深層次地建立特征與目標函數(shù)之間的映射。
之后叮称,使用該模型對另外 1393 例外部患者的回溯數(shù)據(jù)分析來檢驗預測性能种玛。外部測試集中 106 例發(fā)展成重癥的患者中,只有 2 例存在數(shù)據(jù)異常的患者被錯誤劃分到了低風險組瓤檐。同時赂韵,該模型在不同中心的數(shù)據(jù)上獲得的 C-index
均高于0.85,證明了模型的可靠性與有效性挠蛉。
C-index
指一致性指數(shù)(index of concordance)祭示,通過評估模型預測結(jié)果與實際觀察結(jié)果的符合程度,以評價模型的預測準確性碌秸,值越接近1,準確率越高悄窃。
AUC
指受試者工作特征曲線下面積讥电,值在1.0和0.5之間,在AUC>0.5的情況下轧抗,AUC越接近于1恩敌,說明診斷效果越好。
繪制Nomagram圖
總結(jié)
這兩篇文章横媚,都是基于Lasso回歸篩選變量后構(gòu)建Logistic/Cox模型并驗證纠炮。因為第二篇文章多了”生存“數(shù)據(jù),故用了Cox模型之所以這兩篇能發(fā)高分主要是時效性以及全國的樣本庫灯蝴。細心的同學可能已經(jīng)看到恢口,這兩篇文章都是同一個作者,來自廣州的呼吸系統(tǒng)疾病國家重點實驗室穷躁,也就是前幾天很火的那位專碩發(fā)了80幾篇sci的團隊耕肩。我們雖然沒有這么好的資源,但是可以學習借鑒別人的方法和套路。
寫在后面:
小木舟水平有限猿诸,文中難免有些紕漏婚被,希望各位讀者能夠不吝賜教。歡迎大家關(guān)注我的
B站:木舟筆記
梳虽,獲取更多視頻講解址芯。制作不易,希望大家多多點贊
窜觉、在看
谷炸。
往期文章
- 跟著CELL學作圖|1.火山圖
- 跟著Cell學作圖 | 2.柱狀圖+誤差棒+散點+差異顯著性檢驗
- 跟著 Cell 學作圖 | 3.箱線圖+散點+差異顯著性檢驗
- 跟著 Cell 學作圖 | 4.小提琴圖
- 跟著Cell學作圖 | 5.UMAP降維分析
- 跟著Cell學作圖 | 6.時間序列分析(Mfuzz包)
- 跟著Cell學作圖|7.富集分析(Metascape數(shù)據(jù)庫)
- 跟著Cell學作圖|8.富集分析網(wǎng)絡圖(Cytoscape/ClueGO)
- 跟著Cell學作圖|9.PPI分析(GeNets數(shù)據(jù)庫)
- 跟著Cell學作圖|10.復雜熱圖
- 跟著Cell學作圖| 11.Ingenuity Pathway Analysis(IPA)
- 跟著Cell學作圖 | 12.韋恩圖(Vennerable包)