導(dǎo)讀
1. ROC曲線:
ROC曲線(receiver operating characteristic curve嵌牺,簡稱ROC曲線)揩晴,以真陽性率(靈敏度)為縱坐標(biāo)胯努,假陽性率(1-特異度)為橫坐標(biāo)繪制的曲線东臀。ROC最初是在二戰(zhàn)中被提出的信號檢測理論楞艾,后來又被引入了心理學(xué)進(jìn)行信號的知覺檢測参咙,現(xiàn)在ROC曲線已經(jīng)成為非常重要和常見的統(tǒng)計分析方法。
2. ROC分析:
ROC分析首先是根據(jù)學(xué)習(xí)器的預(yù)測結(jié)果對樣例進(jìn)行排序硫眯,按此順序逐個把樣本作為正例進(jìn)行預(yù)測蕴侧,每次計算出兩個重要量的值(TPR、FPR)两入,分別以它們?yōu)闄M净宵、縱坐標(biāo)作圖。AUC的值是ROC曲線下面積的大小裹纳,用來評價分類器的performance择葡。通常,AUC的值介于0.5到1.0之間剃氧,較大的AUC代表了較好的performance敏储。
如何制作如下圖的多指標(biāo)ROC曲線?
一朋鞍、軟件準(zhǔn)備
- R:利用rnorm函數(shù)產(chǎn)生隨機(jī)數(shù)已添,作為graphpad繪圖的輸入文件。
- Graphpad prism5:繪制ROC曲線滥酥。
二更舞、過程
1. 利用R模擬輸入文件
產(chǎn)生兩組正態(tài)分布隨機(jī)數(shù),控制mean和SD恨狈。
GroupA <- as.data.frame(rnorm (30, mean=10, sd=5))
GroupB <- as.data.frame(rnorm (30, mean=15, sd=5))保存疏哗。將兩組數(shù)據(jù)均分給Genus和Phylum。
write.xlsx(data1, file="C:/mywd/data1.xlsx")
write.xlsx(data2, file="C:/mywd/data2.xlsx")-
整理后如下:
2. 打開graph prism5禾怠,Creat一個column圖返奉。
3. 重命名Data Table,向graphpad表格中粘入Genus數(shù)據(jù)吗氏,點擊analysis芽偏,選擇ROC curve,OK確定弦讽。
4. 勾選Line of identity污尉,OK確定膀哲。graphpad進(jìn)行ROC分析和繪圖。
5. 點擊Area查看AUC值被碗、P值等統(tǒng)計結(jié)果某宪。點擊ROC of Genus查看ROC曲線。
6. 依次點擊File, New, New Data Table and Graph新建一個數(shù)據(jù)表锐朴。
7. 按照相同的方法得到第二個指標(biāo)的ROC圖兴喂,ROC of Phylum。
8. 合并兩個ROC曲線焚志。雙擊ROC圖進(jìn)入Format Graph衣迷,依次點擊Data Sets on Graph,ROC of Phylum B Identify %酱酬,Add壶谒。在新彈出的Add Data Sets to Graph中找到并選中ROC of Genus ROC Curve,點擊OK膳沽。在新彈出的Format Graph再次點擊OK汗菜。
9. 成功合并兩條曲線。
10. 雙擊曲線或坐標(biāo)軸贵少,在Format Graph中設(shè)置曲線或坐標(biāo)軸的參數(shù)呵俏。方法如下:
-
這樣我們就得到了兩個指標(biāo)的ROC曲線:
參考
- https://www.plob.org/article/12476.html
- https://jingyan.baidu.com/article/455a99506f1669a166277816.html
同步發(fā)布于微信公眾號:微生態(tài)