機器學習性能評估指標

在機器學習蝗碎、數(shù)據(jù)挖掘猛蔽、推薦系統(tǒng)完成建模之后剥悟,需要對模型的效果做評價。
業(yè)內(nèi)目前常常采用的評價指標有準確率(Precision)曼库、召回率(Recall)区岗、F值(F-Measure)等,下圖是不同機器學習算法的評價指標:


混淆矩陣:

True Positive(真正毁枯,TP):將正類預測為正類數(shù)
True Negative(真負慈缔,TN):將負類預測為負類數(shù)
False Positive(假正,F(xiàn)P):將負類預測為正類數(shù)誤報 (Type I error)
False Negative(假負种玛,F(xiàn)N):將正類預測為負類數(shù)→漏報 (Type II error)


1藐鹤、準確率(Accuracy)
準確率(accuracy)計算公式為:

2、錯誤率(Error rate)
錯誤率則與準確率相反蒂誉,描述被分類器錯分的比例教藻,error rate = (FP+FN)/(TP+TN+FP+FN),對某一個實例來說右锨,分對與分錯是互斥事件括堤,所以accuracy =1 - error rate。
3、靈敏度(sensitive)
sensitive = TP/P悄窃,表示的是所有正例中被分對的比例讥电,衡量了分類器對正例的識別能力。
4轧抗、特效度(specificity)
specificity = TN/N恩敌,表示的是所有負例中被分對的比例,衡量了分類器對負例的識別能力横媚。
5纠炮、精確率(Precision)
精確率(precision)定義為:

6、召回率(recall)/ 查全率
召回率是覆蓋面的度量灯蝴,度量有多少個正例被分為正例恢口,recall=TP/P=sensitive,可以看到召回率與靈敏度是一樣的穷躁。
7耕肩、綜合評價指標(F-Measure)/(F-Score)
Precision和Recall指標有時候會出現(xiàn)的矛盾的情況,這樣就需要綜合考慮他們问潭,最常見的方法就是F-Measure(又稱為F-Score)猿诸。
F-Measure是Precision和Recall加權(quán)調(diào)和平均:

當參數(shù)α=1時,就是最常見的F1-Score狡忙,也即

可知 F1-Score 綜合了 Precision 和 Recall 的結(jié)果梳虽,當F1-Score較高時則能說明試驗方法比較有效。
8去枷、ROC曲線:
ROC(Receiver Operating Characteristic)曲線是以假正率(FP_rate)和真正率(TP_rate)為軸的曲線怖辆,ROC曲線下面的面積我們叫做AUC,如下圖所示:

其中:

(1)曲線與FP_rate軸圍成的面積(記作AUC)越大删顶,說明性能越好竖螃,即圖上L2曲線對應的性能優(yōu)于曲線L1對應的性能。即:曲線越靠近A點(左上方)性能越好逗余,曲線越靠近B點(右下方)曲線性能越差特咆。
(2)A點是最完美的Performance點,B處是性能最差點录粱。
(3)位于C-D線上的點說明算法性能和隨機猜測是一樣的–如C腻格、D、E點啥繁。位于C-D之上(即曲線位于白色的三角形內(nèi))說明算法性能優(yōu)于隨機猜測–如G點菜职,位于C-D之下(即曲線位于灰色的三角形內(nèi))說明算法性能差于隨機猜測–如F點。
(4)雖然ROC曲線相比較于Precision和Recall等衡量指標更加合理旗闽,但是其在高不平衡數(shù)據(jù)條件下的的表現(xiàn)仍然過于理想酬核,不能夠很好的展示實際情況蜜另。

9、PR曲線:
PR(Precision-Recall)曲線嫡意。
舉個例子(例子來自Paper:Learning from eImbalanced Data):
假設N_c >> P_c(即Negative的數(shù)量遠遠大于Positive的數(shù)量)举瑰,若FP很大,即有很多N(假)的樣本被預測為P(真)蔬螟,因為

此迅,因此FP_rate的值仍然很小(如果利用ROC曲線則會判斷其性能很好旧巾,但是實際上其性能并不好)耸序,但是如果利用PR,因為Precision綜合考慮了TP和FP的值菠齿,因此在數(shù)據(jù)極度不平衡的情況下(Positive的樣本相對較少)佑吝,PR曲線可能比ROC曲線更實用。

10绳匀、MSE(Mean Square Error)均方誤差
MSE是真實值與預測值的差值的平方然后求和平均 ; 通過平方的形式便于求導,所以常被用作線性回歸的損失函數(shù)炸客。

11疾棵、MAE(Mean Absolute Error)平均絕對誤差
MAE是絕對誤差的平均值;可以更好地反映預測值誤差的實際情況。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末痹仙,一起剝皮案震驚了整個濱河市是尔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌开仰,老刑警劉巖拟枚,帶你破解...
    沈念sama閱讀 211,290評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異众弓,居然都是意外死亡恩溅,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評論 2 385
  • 文/潘曉璐 我一進店門谓娃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來脚乡,“玉大人,你說我怎么就攤上這事滨达∧坛恚” “怎么了?”我有些...
    開封第一講書人閱讀 156,872評論 0 347
  • 文/不壞的土叔 我叫張陵捡遍,是天一觀的道長锌订。 經(jīng)常有香客問我,道長画株,這世上最難降的妖魔是什么辆飘? 我笑而不...
    開封第一講書人閱讀 56,415評論 1 283
  • 正文 為了忘掉前任涩搓,我火速辦了婚禮,結(jié)果婚禮上劈猪,老公的妹妹穿的比我還像新娘昧甘。我一直安慰自己,他們只是感情好战得,可當我...
    茶點故事閱讀 65,453評論 6 385
  • 文/花漫 我一把揭開白布充边。 她就那樣靜靜地躺著,像睡著了一般常侦。 火紅的嫁衣襯著肌膚如雪浇冰。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,784評論 1 290
  • 那天聋亡,我揣著相機與錄音肘习,去河邊找鬼。 笑死坡倔,一個胖子當著我的面吹牛漂佩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播罪塔,決...
    沈念sama閱讀 38,927評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼投蝉,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了征堪?” 一聲冷哼從身側(cè)響起瘩缆,我...
    開封第一講書人閱讀 37,691評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎佃蚜,沒想到半個月后庸娱,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,137評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡谐算,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,472評論 2 326
  • 正文 我和宋清朗相戀三年熟尉,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片氯夷。...
    茶點故事閱讀 38,622評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡臣樱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出腮考,到底是詐尸還是另有隱情雇毫,我是刑警寧澤,帶...
    沈念sama閱讀 34,289評論 4 329
  • 正文 年R本政府宣布踩蔚,位于F島的核電站棚放,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏馅闽。R本人自食惡果不足惜飘蚯,卻給世界環(huán)境...
    茶點故事閱讀 39,887評論 3 312
  • 文/蒙蒙 一馍迄、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧局骤,春花似錦攀圈、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至凯傲,卻和暖如春犬辰,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背冰单。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工幌缝, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人诫欠。 一個月前我還...
    沈念sama閱讀 46,316評論 2 360
  • 正文 我出身青樓涵卵,卻偏偏與公主長得像,于是被迫代替她去往敵國和親呕诉。 傳聞我的和親對象是個殘疾皇子缘厢,可洞房花燭夜當晚...
    茶點故事閱讀 43,490評論 2 348

推薦閱讀更多精彩內(nèi)容