臨床資料收集:
1.提出科學(xué)問題
2.收集臨床資料
3.選擇合適統(tǒng)計(jì)學(xué)方法
4.選擇合適的統(tǒng)計(jì)軟件
5.評(píng)估結(jié)果宾抓,結(jié)合專業(yè)知識(shí)回答科學(xué)問題
這個(gè)框架真的很好用的,我在間接性殘廢地學(xué)習(xí)統(tǒng)計(jì)一年多以來幼衰,覺著這樣的框架才是真正的功夫。將自己的統(tǒng)計(jì)工作缀雳,時(shí)刻比對(duì)這這五點(diǎn)進(jìn)行下去渡嚣,才不至于工作做了一半發(fā)現(xiàn)少了數(shù)據(jù),然后重頭返工肥印,要么就是做到一半不知道怎么結(jié)束這項(xiàng)工作识椰。
坑,是開始時(shí)候自己就給自己挖好了深碱。我要做的就是選擇一條好走的路腹鹉,沒有坑的路。
這個(gè)框架里敷硅,最難的是第一條功咒,提出一個(gè)科學(xué)問題,往往別人忽略绞蹦。
第三第四是結(jié)果的展示階段力奋,出了一張圖,p值<0.05然后就可以萬事大吉幽七,所以也是各種帖子熱衷展示的景殷。當(dāng)然,就像自己的內(nèi)在不能總是拿出來展示澡屡,只能通過拍照的方式進(jìn)行外表展示猿挚。所以,方法類的學(xué)習(xí)帖子一般作為自己學(xué)習(xí)筆記真的非常棒驶鹉,但是為了技術(shù)而技術(shù)绩蜻,為了搞出一個(gè)模型去收集數(shù)據(jù),有點(diǎn)本末倒置了梁厉。我們是為了想解決一個(gè)實(shí)實(shí)在在臨床問題辜羊,去收集數(shù)據(jù),用統(tǒng)計(jì)學(xué)方法得出結(jié)論词顾,從而提示醫(yī)生如何對(duì)患者采取治療措施八秃,從而減少患者住院時(shí)間,減輕患者的病情肉盹,延長患者總生存時(shí)間昔驱。(這是我的初心吧)
閑話聊完,開始水這一篇的主角臨床預(yù)測(cè)模型上忍。我是看到公眾號(hào)上《簡單易懂》骤肛,覺得寫的比較好纳本,就忍不住想自己也寫一點(diǎn)東西,畢竟自己摸魚一年多了腋颠,一篇像樣的文章都沒出來繁成,總得要做點(diǎn)什么來緩解自己無處釋放的才華,所以打算對(duì)照自己學(xué)習(xí)路徑以及課題需要淑玫,進(jìn)行一系列臨床模型構(gòu)建的筆記輸出巾腕。
臨床模型初印象
《簡單易懂》上對(duì)于臨床預(yù)測(cè)模型的解釋和舉例,真的很通俗易懂了絮蒿。臨床模型是什么嘞:
- 臨床模型是公式
- 臨床模型是一種 方法
- 這個(gè)方法關(guān)于分類和回歸
分類和回歸的區(qū)別在于輸出變量的類型尊搬。
定量輸出稱為回歸,或者說是連續(xù)變量預(yù)測(cè)土涝; 定性輸出稱為分類佛寿,或者說是離散變量預(yù)測(cè)。
舉個(gè)例子: 預(yù)測(cè)明天的氣溫是多少度但壮,這是一個(gè)回歸任務(wù)冀泻; 預(yù)測(cè)明天是陰、晴還是雨蜡饵,就是一個(gè)分類任務(wù)腔长。
(詳見參考資料3)
臨床模型,把它看成y=ax+b验残,通過身高預(yù)測(cè)孩子的升高,就像我們?cè)趦嚎瓶荚囍杏龅浇砣椋o你有幾個(gè)骨頭預(yù)測(cè)小孩多大一樣您没。而這個(gè)公式怎么來的,以及這個(gè)公式靠不靠譜就是模型構(gòu)建的大部分內(nèi)容了胆绊。
學(xué)術(shù)一點(diǎn)話就是模型構(gòu)建和模型評(píng)價(jià)氨鹏,在醫(yī)學(xué)類臨床資料統(tǒng)計(jì)中,我們常用的有線性回歸压状,邏輯回歸仆抵,cox回歸等。
第一步种冬,挑選合適的因素
在我們拿到收集好的數(shù)據(jù)時(shí)候镣丑,我們要開始構(gòu)建預(yù)測(cè)模型了,我們首先面對(duì)的一個(gè)問題就是該選擇什么的因素納入分析娱两?
周支瑞老師對(duì)這種情況給出了三條原則:
1.當(dāng)自己樣本量足夠大(每一個(gè)研究因素至少有20個(gè)患者莺匠,比如我想研究20個(gè)因素,那么我有400例以上的患者)十兢,那就SPSS軟件中在Logistic回歸和Cox回歸中給出了7種變量篩選的方法趣竣,任君挑選摇庙;
2.如果不滿足樣本足夠大,那么這個(gè)時(shí)候比較通用的做法是單因素cox回歸(詳見參考資料4遥缕,5)卫袒。用spss點(diǎn)點(diǎn)點(diǎn),把所有因素都放進(jìn)去单匣,然后點(diǎn)cox回歸夕凝,看p值,將p值<0.1的因素都挑選出來封孙,進(jìn)行多因素cox回歸迹冤;
3.這個(gè)時(shí)候會(huì)出現(xiàn),統(tǒng)計(jì)學(xué)不顯著但是臨床意義明確虎忌,例如泡徙,前列腺癌的gleason評(píng)分,單因素分析結(jié)果與已知臨床專業(yè)知識(shí)決定納入回歸方程的變量膜蠢。
第二步堪藐,選擇合適統(tǒng)計(jì)學(xué)方法,構(gòu)建模型
這張周支瑞老師總結(jié)的“三種預(yù)測(cè)模型的研究思路”挑围,真的大而全礁竞。
二分類變量預(yù)測(cè)模型的構(gòu)建
步驟1. 首先篩選影響低出獨(dú)立影響因素,構(gòu)建Logistic回歸模型杉辙;
步驟2.繪制Nomogram模捂;
步驟3.計(jì)算模型的區(qū)分度 C-Statistics。有三種方法可以計(jì)算其C-Statistics蜘矢。
方法1. 利用 {rms} 包中的 lrm 函數(shù)構(gòu)建Logistic回歸模型狂男,直接讀取模型Rank Discrim.參數(shù) C,即為C-Statistics品腹。
方法2. 構(gòu)建Logistic回歸模型岖食,predict函數(shù)計(jì)算模型預(yù)測(cè)概率,然后利用ROCR包根據(jù)此預(yù)測(cè)概率畫ROC曲線舞吭,并計(jì)算曲線下面積AUC泡垃,此即為C-Statistics。注:此方法與SPSS中的計(jì)算方法一致羡鸥。
方法3. 構(gòu)建Logistic回歸模型蔑穴,predict函數(shù)計(jì)算模型預(yù)測(cè)概率,利用Hmisc包中somers2函數(shù)直接計(jì)算ROC曲線下面積AUC惧浴。注:此方法與SPSS中的計(jì)算方法一致澎剥。
不管那種方法都未給出標(biāo)準(zhǔn)誤,所以可信區(qū)間的計(jì)算就很麻煩,如果一定要報(bào)告C-Statistics可信區(qū)間哑姚,可以考慮使用SPSS軟件進(jìn)行ROC分析祭饭,軟件可以直接給出AUC的可信區(qū)間。
步驟4.重抽樣的方法進(jìn)行模型驗(yàn)證叙量,并繪制Calibration曲線
生存資料預(yù)測(cè)模型構(gòu)建
步驟 1. 我們首先使用Cox回歸基于構(gòu)建預(yù)測(cè)模型并篩選獨(dú)立預(yù)后因素(用于建模的數(shù)據(jù)集一般稱為訓(xùn)練集或者內(nèi)部數(shù)據(jù)集)倡蝙。
步驟 2. 我們就以這三個(gè)獨(dú)立的預(yù)后因素繪制Nomogram,建模完成绞佩。
步驟 3. 對(duì)上述兩步所構(gòu)建的預(yù)測(cè)模型的區(qū)分能力 (Discrimination) 進(jìn)行評(píng)價(jià)寺鸥,并計(jì)算C-index。
Cox回歸的C-index計(jì)算方法:
方法1:直接從survival包的函數(shù)coxph結(jié)果中輸出品山,需要R的版本高于2.15.需要提前安裝survival包可以看出這種方法輸出了C-index (對(duì)應(yīng)模型參數(shù)C)胆建,也輸出了標(biāo)準(zhǔn)誤,95%可信區(qū)間就可以通過C加減1.96*se得到肘交。并且這種方法也適用于很多指標(biāo)聯(lián)合笆载。
方法2:利用rms包中的cph函數(shù)和validate函數(shù),可提供un-adjusted和bias adjusted C指數(shù)兩種涯呻。
步驟 4. 對(duì)模型進(jìn)行驗(yàn)證凉驻,可通過外部數(shù)據(jù)集進(jìn)行驗(yàn)證,如果無法獲得外部數(shù)據(jù)集复罐,筆者推薦采用Bootstrap沖抽樣法基于訓(xùn)練集驗(yàn)證模型并繪制校正曲線(Calibration plot)涝登。
Cox回歸模型中C-Index計(jì)算,Nomogram繪制過程效诅,Bootstrap法驗(yàn)證模型及繪制標(biāo)準(zhǔn)曲線
凈重新分類指數(shù)(NRI)這個(gè)指標(biāo)最初用于評(píng)價(jià)診斷試驗(yàn)中新的診斷指標(biāo)較舊診斷指標(biāo)把研究對(duì)象進(jìn)行正確分類在數(shù)量上的變化胀滚。
綜合判別改善指數(shù)(Integrated Discrimination Improvement, IDI)用于判斷預(yù)測(cè)模型改善情況
決策曲線(Decision Curve Analysis):尋找一個(gè)預(yù)測(cè)凈受益最大的模型
第三步,對(duì)模型進(jìn)行驗(yàn)證
外部數(shù)據(jù)驗(yàn)證
- Logistic回歸模型進(jìn)行外部驗(yàn)證的方法乱投,包括校準(zhǔn)度評(píng)估和區(qū)分度評(píng)估蛛淋。
- Cox回歸模型進(jìn)行深度評(píng)價(jià)
內(nèi)部數(shù)據(jù)重抽樣驗(yàn)證
第四步,對(duì)模型進(jìn)行解釋
這個(gè)是真功夫篡腌,就像單細(xì)胞測(cè)序,有的人4例結(jié)腸癌單細(xì)胞測(cè)序可以發(fā)在NC勾效,有了人只能一直砸在手里嘹悼,總是分析不出來。所以层宫,功夫在日常積累中杨伙。
我是看著周支瑞老師的書長大的,從《統(tǒng)計(jì)學(xué)》三本萌腿,到《臨床預(yù)測(cè)模型》都是從買的正版書限匣,如果大家想要專門深入學(xué)習(xí),他的書真的可以買來反復(fù)演練毁菱,一定會(huì)有收獲米死。還有他的公眾號(hào)《 臨床研究與醫(yī)學(xué)統(tǒng)計(jì)》也是干活滿滿锌历,安利一波
參考資料: