剛開(kāi)始接觸這兩個(gè)概念的時(shí)候總搞混啤它,時(shí)間一長(zhǎng)就記不清了员舵。
實(shí)際上非常簡(jiǎn)單讯柔,精確率是針對(duì)我們預(yù)測(cè)結(jié)果而言的,它表示的是預(yù)測(cè)為正的樣本中有多少是真正的正樣本臭胜。那么預(yù)測(cè)為正就有兩種可能了莫其,一種就是把正類(lèi)預(yù)測(cè)為正類(lèi)(TP)癞尚,另一種就是把負(fù)類(lèi)預(yù)測(cè)為正類(lèi)(FP),也就是
而召回率是針對(duì)我們?cè)瓉?lái)的樣本而言的乱陡,它表示的是樣本中的正例有多少被預(yù)測(cè)正確了浇揩。那也有兩種可能,一種是把原來(lái)的正類(lèi)預(yù)測(cè)成正類(lèi)(TP)憨颠,另一種就是把原來(lái)的正類(lèi)預(yù)測(cè)為負(fù)類(lèi)(FN)胳徽。
其實(shí)就是分母不同,一個(gè)分母是預(yù)測(cè)為正的樣本數(shù)爽彤,另一個(gè)是原來(lái)樣本中所有的正樣本數(shù)养盗。
作者:Charles Xiao鏈接:https://www.zhihu.com/question/19645541/answer/91694636來(lái)源:知乎著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán)适篙,非商業(yè)轉(zhuǎn)載請(qǐng)注明出處往核。
在信息檢索領(lǐng)域,精確率和召回率又被稱(chēng)為查準(zhǔn)率和查全率嚷节,查準(zhǔn)率=檢索出的相關(guān)信息量 / 檢索出的信息總量查全率=檢索出的相關(guān)信息量 / 系統(tǒng)中的相關(guān)信息總量二.舉個(gè)栗子假設(shè)我們手上有60個(gè)正樣本聂儒,40個(gè)負(fù)樣本,我們要找出所有的正樣本丹喻,系統(tǒng)查找出50個(gè)薄货,其中只有40個(gè)是真正的正樣本,計(jì)算上述各指標(biāo)碍论。
TP: 將正類(lèi)預(yù)測(cè)為正類(lèi)數(shù) 40
FN: 將正類(lèi)預(yù)測(cè)為負(fù)類(lèi)數(shù) 20
FP: 將負(fù)類(lèi)預(yù)測(cè)為正類(lèi)數(shù) 10
TN: 將負(fù)類(lèi)預(yù)測(cè)為負(fù)類(lèi)數(shù) 30
準(zhǔn)確率(accuracy) = 預(yù)測(cè)對(duì)的/所有 = (TP+TN)/(TP+FN+FP+TN) = 70%精確率(precision) = TP/(TP+FP) = 80%召回率(recall) = TP/(TP+FN) = 2/3除此之外谅猾,還有ROC曲線(xiàn),PR曲線(xiàn)鳍悠,AUC等評(píng)價(jià)指標(biāo)税娜,可以參見(jiàn)我的博客:機(jī)器學(xué)習(xí)性能評(píng)估指標(biāo)
作者:Charles Xiao鏈接:https://www.zhihu.com/question/19645541/answer/91694636來(lái)源:知乎著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán)藏研,非商業(yè)轉(zhuǎn)載請(qǐng)注明出處敬矩。