ROC曲線繪制中常見的問題及其解決方案

本文主要目的介紹做ROC曲線時(shí)遇到的問題和解決方法

#? SPSS可導(dǎo)入excel表格,真是省時(shí)間省力氣

#? 如何在SPSS中繪制ROC曲線弊攘,加深了一點(diǎn)新的體會(huì)就是在統(tǒng)計(jì)學(xué)中抢腐,應(yīng)用一個(gè)方法去解決問題,首先需要明確用到的變量類型襟交,定距(Scale)氓栈、定序(Ordinal)、定類(Nominal)婿着。

主要遇到的問題有兩個(gè)

?一是AUC值小于0.5授瘦,當(dāng)時(shí)特別發(fā)愁,因?yàn)槭孪炔榈降馁Y料是竟宋,我做出來診斷標(biāo)準(zhǔn)3 有一個(gè)的曲線下面積小于0.5提完。再次sou后發(fā)現(xiàn)可以通過轉(zhuǎn)換0和1陽(yáng)性事件來變通。個(gè)人理解是只要P值有意義丘侠,那么可以通過轉(zhuǎn)換來實(shí)現(xiàn)AUC值大于0.5徒欣。

? ? 二是今天最大的問題,分組標(biāo)準(zhǔn)從數(shù)據(jù)的中位數(shù)蜗字,平均數(shù)打肝,還有ROC值線上取CUTOFF,我決定選擇CUTOFF挪捕,圖啥的也畫好的了吧粗梭,這個(gè)值到底是多少?文獻(xiàn)里都是這么寫的级零。

我還走了一遍EXCEL表格期待找到我想要的CUTOFF

此時(shí)断医,一個(gè)優(yōu)秀的科研工作者的內(nèi)心有點(diǎn)煩躁,于是她想到了發(fā)朋友圈和繼續(xù)谷歌的方法奏纪,甚至想去問老板鉴嗤。為了面子,她繼續(xù)搜尋序调,看到了這樣一句話:

通常情況下醉锅,SCI雜志會(huì)要求我們計(jì)算診斷實(shí)驗(yàn)中的最佳切割點(diǎn),cutoff值发绢,而SPSS恰好不能提供硬耍。R軟件是一款統(tǒng)計(jì)功能十分強(qiáng)大的開源軟件,OptimalCutpoints包是一個(gè)專門做ROC曲線和cutoff值的包朴摊,利用R軟件可以輕松實(shí)現(xiàn)默垄。不想寫命令的可以使用基于OptimalCutpoints包的網(wǎng)頁(yè)工具即可。

所以甚纲,那些文章里的CUTOFF值口锭,只用SPSS,難道是目測(cè)出來的?

網(wǎng)頁(yè)工具鏈接:強(qiáng)大的ROC頁(yè)面工具easyROC: a web-tool for ROC curve analysis (ver. 1.3.1)

教程可見醫(yī)統(tǒng)界推送:ROC曲線截?cái)帱c(diǎn)(cutoff值)的計(jì)算

# spss的數(shù)據(jù)導(dǎo)出

? ?其實(shí)鹃操,如果她能養(yǎng)成一個(gè)好習(xí)慣韭寸,想好整個(gè)研究方案,就不用走#3之路了荆隘,數(shù)據(jù)導(dǎo)出后恩伺,NULL#值和時(shí)間的亂碼都是很煩人的事情。

# R語言的數(shù)據(jù)讀入

注定是意難忘了椰拒,深夜使用網(wǎng)頁(yè)工具反復(fù)運(yùn)算晶渠,查詢后得知-------GG,網(wǎng)頁(yè)極不穩(wěn)定燃观,不一定能順利做出來褒脯,而且部分雜志對(duì)網(wǎng)頁(yè)結(jié)果認(rèn)可度不高。本次介紹直接用R軟件OptimalCutpoints包來計(jì)算缆毁,結(jié)果具有可重復(fù)性番川。

然后發(fā)現(xiàn)R讀不進(jìn)exc

解決辦法

1.安裝readxl包-TMD的失敗

2.把excel表格轉(zhuǎn)換為TXT

將Excel轉(zhuǎn)TXT,而且在TXT中將表格以“脊框,逗號(hào)”隔開的方式來排序颁督,這樣有利于我們區(qū)分!操作方法:先將Excel表格“文件”-->另存為浇雹,然后選擇“CSV”格式沉御;然后將“CSV”格式文件用“記事本”來打開

此方法經(jīng)驗(yàn)證,有效

#用R進(jìn)行CUTOFF的計(jì)算

找到一篇讓自己非常無語的文章

一篇文章在寫自己這個(gè)程序怎么好箫爷,那你倒是告訴我嚷节,這個(gè)程度在哪里呀聂儒,額虎锚,浪費(fèi)我一番心血為了下載這篇文章,口吐芬芳

#如何了解一個(gè)包的用法

第一種方法衩婚,查看說明書:函數(shù)——?OptimalCutpoints---但是您也只能了解它的說明

查看了說明窜护,于是照著寫代碼,發(fā)現(xiàn)不行非春,參照其示例數(shù)據(jù)elas的格式柱徙,真的委曲求全

改后,我他媽這個(gè)還不行奇昙,我就护侮,也目測(cè)cutoff值好了?

目測(cè)是不可能目測(cè)的,然后發(fā)現(xiàn)CSV格式讀進(jìn)去的储耐,不行羊初。問了程師姐,師姐說,用str_split函數(shù)长赞,我又不敢繼續(xù)問晦攒,只能繼續(xù)探索。

我要怎么把它往上挪一行呢
這真是個(gè)天賜的好技巧得哆,但是如果數(shù)據(jù)太大脯颜, 還是別這么搞了,容易讓自己被動(dòng)

此處省略我是如何重新命名了行贩据,然后進(jìn)行了數(shù)據(jù)轉(zhuǎn)換栋操,大神一句話,菜鳥跑半年

fuck

第二種方法饱亮,親測(cè)有效讼庇,查看其示例數(shù)據(jù),參照其示例數(shù)據(jù)elas的格式(真的委曲求全)近尚,做到數(shù)據(jù)格式和他一樣蠕啄,然后修改相應(yīng)的參數(shù)

elas是OptimalCutpoints包自帶的數(shù)據(jù):該數(shù)據(jù)來自于加利西亞綜合醫(yī)院的心臟病科。本研究旨在評(píng)估白細(xì)胞彈性蛋白酶測(cè)定在冠狀動(dòng)脈疾哺甓汀(CAD)診斷中的臨床應(yīng)用價(jià)值歼跟。這個(gè)數(shù)據(jù)框,包括了3個(gè)變量格遭,納入141例病例哈街。elas:白細(xì)胞彈性蛋白酶。為數(shù)值型向量拒迅;status疾病狀態(tài)(存在/不存在冠狀動(dòng)脈疾采亍)。賦值為0和1璧微;gender患者的性別分為兩個(gè)水平作箍,Male和Female。

install.packages("OptimalCutpoints") #安裝OptimalCutpoints包

library(OptimalCutpoints) #加載OptimalCutpoints包

data(elas) #加載數(shù)據(jù)

summary(elas) #總結(jié)數(shù)據(jù)

head(elas,5) #查看前5行數(shù)據(jù)

# Defaut method

optimal.cutpoint.Youden <- optimal.cutpoints(X = "elas", status = "status", tag.healthy = 0,?

methods = "Youden", data = elas, pop.prev = NULL, categorical.cov = "gender",?

control = control.cutpoints(), ci.fit = FALSE, conf.level = 0.95, trace = FALSE)

summary(optimal.cutpoint.Youden)

plot(optimal.cutpoint.Youden)

參考了公眾號(hào)這個(gè)文章:ROC曲線最佳截?cái)帱c(diǎn)(cutoff值)計(jì)算-OptimalCutpoints包簡(jiǎn)介

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末前硫,一起剝皮案震驚了整個(gè)濱河市胞得,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌屹电,老刑警劉巖阶剑,帶你破解...
    沈念sama閱讀 222,807評(píng)論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異危号,居然都是意外死亡牧愁,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,284評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門外莲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來猪半,“玉大人,你說我怎么就攤上這事“炝洌” “怎么了烘绽?”我有些...
    開封第一講書人閱讀 169,589評(píng)論 0 363
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)俐填。 經(jīng)常有香客問我安接,道長(zhǎng),這世上最難降的妖魔是什么英融? 我笑而不...
    開封第一講書人閱讀 60,188評(píng)論 1 300
  • 正文 為了忘掉前任盏檐,我火速辦了婚禮,結(jié)果婚禮上驶悟,老公的妹妹穿的比我還像新娘胡野。我一直安慰自己,他們只是感情好痕鳍,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,185評(píng)論 6 398
  • 文/花漫 我一把揭開白布硫豆。 她就那樣靜靜地躺著,像睡著了一般笼呆。 火紅的嫁衣襯著肌膚如雪熊响。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,785評(píng)論 1 314
  • 那天诗赌,我揣著相機(jī)與錄音汗茄,去河邊找鬼。 笑死铭若,一個(gè)胖子當(dāng)著我的面吹牛洪碳,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播叼屠,決...
    沈念sama閱讀 41,220評(píng)論 3 423
  • 文/蒼蘭香墨 我猛地睜開眼瞳腌,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了环鲤?” 一聲冷哼從身側(cè)響起纯趋,我...
    開封第一講書人閱讀 40,167評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎冷离,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體纯命,經(jīng)...
    沈念sama閱讀 46,698評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡西剥,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,767評(píng)論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了亿汞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瞭空。...
    茶點(diǎn)故事閱讀 40,912評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出咆畏,到底是詐尸還是另有隱情南捂,我是刑警寧澤,帶...
    沈念sama閱讀 36,572評(píng)論 5 351
  • 正文 年R本政府宣布旧找,位于F島的核電站溺健,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏钮蛛。R本人自食惡果不足惜鞭缭,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,254評(píng)論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望魏颓。 院中可真熱鬧岭辣,春花似錦、人聲如沸甸饱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,746評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)叹话。三九已至搞动,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間渣刷,已是汗流浹背鹦肿。 一陣腳步聲響...
    開封第一講書人閱讀 33,859評(píng)論 1 274
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留辅柴,地道東北人箩溃。 一個(gè)月前我還...
    沈念sama閱讀 49,359評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像碌嘀,于是被迫代替她去往敵國(guó)和親涣旨。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,922評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容