在訓練好模型后做predict時正林,需要有一系列評價指標,以下是常用的幾個:
true positives (納真颤殴,真陽性)? ??
false positives(納偽觅廓,假陽性)
false negatives(去真,假陰性)檢測為negative實際為positive
true negatives? (去偽涵但,真陰性)
Recall(召回率):所有正確的信息或者相關的信息(wanted)被檢測出來的比例杈绸;
Precision(準確率):被檢測出來的信息當中 正確的或者相關的(也就是你想要的)信息中所占的比例;
F1-Meature(綜合評價指標)
在實際當中我們當然希望檢索的結果P越高越好矮瘟,R也越高越好瞳脓;事實上這兩者在某些情況下是矛盾的。比如澈侠,我們只搜出了一個結果劫侧,且是準確的,那么P就是100%哨啃,但是R就很低烧栋;而如果我們把所有結果都返回,那么必然R是100%拳球,但是P很低审姓。因此在不同的場合中需要自己判斷希望P比較高還是R比較高。如果是做實驗祝峻,可以繪制Precision-Recall曲線來幫助分析魔吐。
參考:http://blog.csdn.net/t710smgtwoshima/article/details/8215037