本內(nèi)容為【科研私家菜】R語言機(jī)器學(xué)習(xí)與臨床預(yù)測模型系列課程
R小鹽準(zhǔn)備介紹R語言機(jī)器學(xué)習(xí)與預(yù)測模型的學(xué)習(xí)筆記
你想要的R語言學(xué)習(xí)資料都在這里夷野, 快來收藏關(guān)注【科研私家菜】
00 混淆矩陣
混淆矩陣包含四部分的信息:
True negative(TN),稱為真陰率测秸,表明實(shí)際是負(fù)樣本預(yù)測成負(fù)樣本的樣本數(shù)
False positive(FP),稱為假陽率灾常,表明實(shí)際是負(fù)樣本預(yù)測成正樣本的樣本數(shù)
False negative(FN),稱為假陰率沈撞,表明實(shí)際是正樣本預(yù)測成負(fù)樣本的樣本數(shù)
True positive(TP),稱為真陽率缠俺,表明實(shí)際是正樣本預(yù)測成正樣本的樣本數(shù)
01 準(zhǔn)確度
準(zhǔn)確度是一個(gè)指標(biāo)贷岸,它給出了我們的模型正確預(yù)測的分?jǐn)?shù)。
準(zhǔn)確度=正確預(yù)測數(shù)/預(yù)測總數(shù)偿警。
02 召回率(敏感度或真正例率)
召回率給出你正確識(shí)別為陽性的分?jǐn)?shù)。召回率表示的是樣本中的陽性有多少被預(yù)測正確了落剪。那也有兩種可能尿庐,一種是把原來的陽性預(yù)測成正類(TP),另一種就是把原來的陽性預(yù)測為負(fù)類(FN)抄瑟。
03 精確度
精確度指所有預(yù)測為陽性結(jié)果中正確識(shí)別為陽性的分?jǐn)?shù)皮假。
04 F1分?jǐn)?shù)
F1分?jǐn)?shù)為模型精度和召回率的調(diào)和平均值
04 F1分?jǐn)?shù)
ROC是另一種常用的評(píng)估工具。它給出了模型在0到1之間每一個(gè)可能的決策點(diǎn)的敏感性和特異性贺纲。對(duì)于具有概率輸出的分類問題褪测,閾值可以將概率輸出轉(zhuǎn)換為分類潦刃。
對(duì)于每個(gè)可能的閾值,ROC曲線繪制假正例率與真正例率乖杠。
假正例率:被錯(cuò)誤分類為正例的反例實(shí)例的比例澄成。
真正例率:正確預(yù)測為正例的正例實(shí)例的比例。
ROC曲線一定程度上可以反映分類器的分類效果墨状,但是不夠直觀,我們希望有這么一個(gè)指標(biāo)汛兜,如果這個(gè)指標(biāo)越大越好通今,越小越差,于是辫塌,就有了AUC(Area under the ROC curve),就是ROC曲線下的面積掺喻。AUC直觀地反映了ROC曲線的分類能力储矩。
AUC = 1,代表完美分類器
0.5 < AUC < 1持隧,優(yōu)于隨機(jī)分類器
0 < AUC < 0.5,差于隨機(jī)分類器
關(guān)注R小鹽只酥,關(guān)注科研私家菜(VX_GZH: SciPrivate)呀狼,有問題請(qǐng)聯(lián)系R小鹽。讓我們一起來學(xué)習(xí) R語言機(jī)器學(xué)習(xí)與臨床預(yù)測模型