當(dāng)在談臨床預(yù)測(cè)模型時(shí)候况鸣,我們究竟在說啥?

臨床資料收集:

1.提出科學(xué)問題

2.收集臨床資料

3.選擇合適統(tǒng)計(jì)學(xué)方法

4.選擇合適的統(tǒng)計(jì)軟件

5.評(píng)估結(jié)果宾抓,結(jié)合專業(yè)知識(shí)回答科學(xué)問題

這個(gè)框架真的很好用的,我在間接性殘廢地學(xué)習(xí)統(tǒng)計(jì)一年多以來幼衰,覺著這樣的框架才是真正的功夫。將自己的統(tǒng)計(jì)工作缀雳,時(shí)刻比對(duì)這這五點(diǎn)進(jìn)行下去渡嚣,才不至于工作做了一半發(fā)現(xiàn)少了數(shù)據(jù),然后重頭返工肥印,要么就是做到一半不知道怎么結(jié)束這項(xiàng)工作识椰。

坑,是開始時(shí)候自己就給自己挖好了深碱。我要做的就是選擇一條好走的路腹鹉,沒有坑的路。

這個(gè)框架里敷硅,最難的是第一條功咒,提出一個(gè)科學(xué)問題,往往別人忽略绞蹦。

第三第四是結(jié)果的展示階段力奋,出了一張圖,p值<0.05然后就可以萬事大吉幽七,所以也是各種帖子熱衷展示的景殷。當(dāng)然,就像自己的內(nèi)在不能總是拿出來展示澡屡,只能通過拍照的方式進(jìn)行外表展示猿挚。所以,方法類的學(xué)習(xí)帖子一般作為自己學(xué)習(xí)筆記真的非常棒驶鹉,但是為了技術(shù)而技術(shù)绩蜻,為了搞出一個(gè)模型去收集數(shù)據(jù),有點(diǎn)本末倒置了梁厉。我們是為了想解決一個(gè)實(shí)實(shí)在在臨床問題辜羊,去收集數(shù)據(jù),用統(tǒng)計(jì)學(xué)方法得出結(jié)論词顾,從而提示醫(yī)生如何對(duì)患者采取治療措施八秃,從而減少患者住院時(shí)間,減輕患者的病情肉盹,延長患者總生存時(shí)間昔驱。(這是我的初心吧)

閑話聊完,開始水這一篇的主角臨床預(yù)測(cè)模型上忍。我是看到公眾號(hào)上《簡單易懂》骤肛,覺得寫的比較好纳本,就忍不住想自己也寫一點(diǎn)東西,畢竟自己摸魚一年多了腋颠,一篇像樣的文章都沒出來繁成,總得要做點(diǎn)什么來緩解自己無處釋放的才華,所以打算對(duì)照自己學(xué)習(xí)路徑以及課題需要淑玫,進(jìn)行一系列臨床模型構(gòu)建的筆記輸出巾腕。

臨床模型初印象

《簡單易懂》上對(duì)于臨床預(yù)測(cè)模型的解釋和舉例,真的很通俗易懂了絮蒿。臨床模型是什么嘞:

  • 臨床模型是公式
  • 臨床模型是一種 方法
  • 這個(gè)方法關(guān)于分類和回歸

分類和回歸的區(qū)別在于輸出變量的類型尊搬。
定量輸出稱為回歸,或者說是連續(xù)變量預(yù)測(cè)土涝; 定性輸出稱為分類佛寿,或者說是離散變量預(yù)測(cè)。
舉個(gè)例子: 預(yù)測(cè)明天的氣溫是多少度但壮,這是一個(gè)回歸任務(wù)冀泻; 預(yù)測(cè)明天是陰、晴還是雨蜡饵,就是一個(gè)分類任務(wù)腔长。
(詳見參考資料3)

臨床模型,把它看成y=ax+b验残,通過身高預(yù)測(cè)孩子的升高,就像我們?cè)趦嚎瓶荚囍杏龅浇砣椋o你有幾個(gè)骨頭預(yù)測(cè)小孩多大一樣您没。而這個(gè)公式怎么來的,以及這個(gè)公式靠不靠譜就是模型構(gòu)建的大部分內(nèi)容了胆绊。

學(xué)術(shù)一點(diǎn)話就是模型構(gòu)建和模型評(píng)價(jià)氨鹏,在醫(yī)學(xué)類臨床資料統(tǒng)計(jì)中,我們常用的有線性回歸压状,邏輯回歸仆抵,cox回歸等。

第一步种冬,挑選合適的因素

在我們拿到收集好的數(shù)據(jù)時(shí)候镣丑,我們要開始構(gòu)建預(yù)測(cè)模型了,我們首先面對(duì)的一個(gè)問題就是該選擇什么的因素納入分析娱两?

周支瑞老師對(duì)這種情況給出了三條原則:

1.當(dāng)自己樣本量足夠大(每一個(gè)研究因素至少有20個(gè)患者莺匠,比如我想研究20個(gè)因素,那么我有400例以上的患者)十兢,那就SPSS軟件中在Logistic回歸和Cox回歸中給出了7種變量篩選的方法趣竣,任君挑選摇庙;

2.如果不滿足樣本足夠大,那么這個(gè)時(shí)候比較通用的做法是單因素cox回歸(詳見參考資料4遥缕,5)卫袒。用spss點(diǎn)點(diǎn)點(diǎn),把所有因素都放進(jìn)去单匣,然后點(diǎn)cox回歸夕凝,看p值,將p值<0.1的因素都挑選出來封孙,進(jìn)行多因素cox回歸迹冤;

3.這個(gè)時(shí)候會(huì)出現(xiàn),統(tǒng)計(jì)學(xué)不顯著但是臨床意義明確虎忌,例如泡徙,前列腺癌的gleason評(píng)分,單因素分析結(jié)果已知臨床專業(yè)知識(shí)決定納入回歸方程的變量膜蠢。

第二步堪藐,選擇合適統(tǒng)計(jì)學(xué)方法,構(gòu)建模型

這張周支瑞老師總結(jié)的“三種預(yù)測(cè)模型的研究思路”挑围,真的大而全礁竞。

image.png

二分類變量預(yù)測(cè)模型的構(gòu)建

步驟1. 首先篩選影響低出獨(dú)立影響因素,構(gòu)建Logistic回歸模型杉辙;

步驟2.繪制Nomogram模捂;

步驟3.計(jì)算模型的區(qū)分度 C-Statistics。有三種方法可以計(jì)算其C-Statistics蜘矢。

方法1. 利用 {rms} 包中的 lrm 函數(shù)構(gòu)建Logistic回歸模型狂男,直接讀取模型Rank Discrim.參數(shù) C,即為C-Statistics品腹。
方法2. 構(gòu)建Logistic回歸模型岖食,predict函數(shù)計(jì)算模型預(yù)測(cè)概率,然后利用ROCR包根據(jù)此預(yù)測(cè)概率畫ROC曲線舞吭,并計(jì)算曲線下面積AUC泡垃,此即為C-Statistics。注:此方法與SPSS中的計(jì)算方法一致羡鸥。
方法3. 構(gòu)建Logistic回歸模型蔑穴,predict函數(shù)計(jì)算模型預(yù)測(cè)概率,利用Hmisc包中somers2函數(shù)直接計(jì)算ROC曲線下面積AUC惧浴。注:此方法與SPSS中的計(jì)算方法一致澎剥。
不管那種方法都未給出標(biāo)準(zhǔn)誤,所以可信區(qū)間的計(jì)算就很麻煩,如果一定要報(bào)告C-Statistics可信區(qū)間哑姚,可以考慮使用SPSS軟件進(jìn)行ROC分析祭饭,軟件可以直接給出AUC的可信區(qū)間。

步驟4.重抽樣的方法進(jìn)行模型驗(yàn)證叙量,并繪制Calibration曲線

生存資料預(yù)測(cè)模型構(gòu)建

步驟 1. 我們首先使用Cox回歸基于構(gòu)建預(yù)測(cè)模型并篩選獨(dú)立預(yù)后因素(用于建模的數(shù)據(jù)集一般稱為訓(xùn)練集或者內(nèi)部數(shù)據(jù)集)倡蝙。

步驟 2. 我們就以這三個(gè)獨(dú)立的預(yù)后因素繪制Nomogram,建模完成绞佩。

步驟 3. 對(duì)上述兩步所構(gòu)建的預(yù)測(cè)模型的區(qū)分能力 (Discrimination) 進(jìn)行評(píng)價(jià)寺鸥,并計(jì)算C-index。

Cox回歸的C-index計(jì)算方法:

方法1:直接從survival包的函數(shù)coxph結(jié)果中輸出品山,需要R的版本高于2.15.需要提前安裝survival包可以看出這種方法輸出了C-index (對(duì)應(yīng)模型參數(shù)C)胆建,也輸出了標(biāo)準(zhǔn)誤,95%可信區(qū)間就可以通過C加減1.96*se得到肘交。并且這種方法也適用于很多指標(biāo)聯(lián)合笆载。

方法2:利用rms包中的cph函數(shù)和validate函數(shù),可提供un-adjusted和bias adjusted C指數(shù)兩種涯呻。

步驟 4. 對(duì)模型進(jìn)行驗(yàn)證凉驻,可通過外部數(shù)據(jù)集進(jìn)行驗(yàn)證,如果無法獲得外部數(shù)據(jù)集复罐,筆者推薦采用Bootstrap沖抽樣法基于訓(xùn)練集驗(yàn)證模型并繪制校正曲線(Calibration plot)涝登。

Cox回歸模型中C-Index計(jì)算,Nomogram繪制過程效诅,Bootstrap法驗(yàn)證模型及繪制標(biāo)準(zhǔn)曲線

凈重新分類指數(shù)(NRI)這個(gè)指標(biāo)最初用于評(píng)價(jià)診斷試驗(yàn)中新的診斷指標(biāo)較舊診斷指標(biāo)把研究對(duì)象進(jìn)行正確分類在數(shù)量上的變化胀滚。

綜合判別改善指數(shù)(Integrated Discrimination Improvement, IDI)用于判斷預(yù)測(cè)模型改善情況

決策曲線(Decision Curve Analysis):尋找一個(gè)預(yù)測(cè)凈受益最大的模型

第三步,對(duì)模型進(jìn)行驗(yàn)證

外部數(shù)據(jù)驗(yàn)證

內(nèi)部數(shù)據(jù)重抽樣驗(yàn)證

第四步,對(duì)模型進(jìn)行解釋

這個(gè)是真功夫篡腌,就像單細(xì)胞測(cè)序,有的人4例結(jié)腸癌單細(xì)胞測(cè)序可以發(fā)在NC勾效,有了人只能一直砸在手里嘹悼,總是分析不出來。所以层宫,功夫在日常積累中杨伙。

我是看著周支瑞老師的書長大的,從《統(tǒng)計(jì)學(xué)》三本萌腿,到《臨床預(yù)測(cè)模型》都是從買的正版書限匣,如果大家想要專門深入學(xué)習(xí),他的書真的可以買來反復(fù)演練毁菱,一定會(huì)有收獲米死。還有他的公眾號(hào)《 臨床研究與醫(yī)學(xué)統(tǒng)計(jì)》也是干活滿滿锌历,安利一波

參考資料:

  1. 簡單易懂:什么是臨床預(yù)測(cè)模型?
  2. 臨床資料統(tǒng)計(jì)分析流程梳理
  3. 淺談機(jī)器學(xué)習(xí)-回歸與分類的區(qū)別
  4. 多因素回歸分析模型中的變量篩選方法
  5. 再談多元回歸分析中的變量篩選方法
  6. 凈重新分類指數(shù)(NRI)的計(jì)算方法
  7. Logistic回歸模型的外部驗(yàn)證
  8. 基于R語言pec包對(duì)Cox回歸模型進(jìn)行深度評(píng)價(jià)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末峦筒,一起剝皮案震驚了整個(gè)濱河市究西,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌物喷,老刑警劉巖卤材,帶你破解...
    沈念sama閱讀 221,430評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異峦失,居然都是意外死亡扇丛,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,406評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門尉辑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來帆精,“玉大人,你說我怎么就攤上這事材蹬∈的唬” “怎么了?”我有些...
    開封第一講書人閱讀 167,834評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵堤器,是天一觀的道長昆庇。 經(jīng)常有香客問我,道長闸溃,這世上最難降的妖魔是什么整吆? 我笑而不...
    開封第一講書人閱讀 59,543評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮辉川,結(jié)果婚禮上表蝙,老公的妹妹穿的比我還像新娘。我一直安慰自己乓旗,他們只是感情好府蛇,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,547評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著屿愚,像睡著了一般汇跨。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上妆距,一...
    開封第一講書人閱讀 52,196評(píng)論 1 308
  • 那天穷遂,我揣著相機(jī)與錄音,去河邊找鬼娱据。 笑死蚪黑,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播忌穿,決...
    沈念sama閱讀 40,776評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼抒寂,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了伴网?” 一聲冷哼從身側(cè)響起蓬推,我...
    開封第一講書人閱讀 39,671評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎澡腾,沒想到半個(gè)月后沸伏,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體忠蝗,經(jīng)...
    沈念sama閱讀 46,221評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡贝搁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,303評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了弛饭。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片澜公。...
    茶點(diǎn)故事閱讀 40,444評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡姆另,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出坟乾,到底是詐尸還是另有隱情迹辐,我是刑警寧澤,帶...
    沈念sama閱讀 36,134評(píng)論 5 350
  • 正文 年R本政府宣布甚侣,位于F島的核電站明吩,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏殷费。R本人自食惡果不足惜印荔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,810評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望详羡。 院中可真熱鬧仍律,春花似錦、人聲如沸实柠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,285評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽窒盐。三九已至草则,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間登钥,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,399評(píng)論 1 272
  • 我被黑心中介騙來泰國打工娶靡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留牧牢,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,837評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像塔鳍,于是被迫代替她去往敵國和親伯铣。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,455評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容