scikit_learn學習筆記五——機器學習度量指標

metrics.png
wiki.png

機器學習度量指標

分類評估指標

TN TP FN FP

TP:預測為正向(P)绍申,實際上預測正確(T),即判斷為正向的正確率
TN:預測為負向(N)顾彰,實際上預測正確(T)极阅,即判斷為負向的正確率
FP:預測為正向(P),實際上預測錯誤(F)涨享,誤報率筋搏,即把負向判斷成了正向
FN:預測為負向(N),實際上預測錯誤(F)厕隧,漏報率奔脐,即把正向判斷稱了負向

Positive Negative
True True Positive(TP) 真陽性 True Negative(TN) 真陰性
False False Positive(FP) 假陽性 False Negative(FN) 假陰性

準確率(Accuracy)

ACC= \frac{TP+TN}{TP+TN+FP+FN}

【注意】當分類問題是平衡(blanced)的時候,準確率可以較好地反映模型的優(yōu)劣程度栏账,但不適用于數(shù)據(jù)集不平衡的時候帖族。

例如:分類問題的數(shù)據(jù)集中本來就有97% 示例是屬于X,只有另外3%不屬于X挡爵,所有示例都被分類成X的時候竖般,準確率仍然高達97%,但這沒有任何意義茶鹃。

精確率Precision

Precision = \frac{TP}{TP+FP}

查準率 即在預測為正向的數(shù)據(jù)中涣雕,有多少預測正確”蒸妫【預測結(jié)果為真的數(shù)據(jù)】

召回率Recall

Recall = \frac{TP}{TP+TN}

查全率 即在所有正向的數(shù)據(jù)中挣郭,有多少預測正確×圃希【樣本原來真的數(shù)據(jù)】

F1-Score

F1 = \frac{2*Precision*Recall}{Precision+Recall}

F1值為精確率和召回率的調(diào)和均值兑障。

ROC(Receiver Operating Characteristic)曲線

先了解以下幾個概念

真正率(True Positive Rate, TPR),又名靈敏度(Sensitivity):分類正確的正樣本個數(shù)占整個正樣本個數(shù)的比例蕉汪。

TPR = \frac{TP}{TP+FN}

假負率(False Negative Rate, FNR):分類錯誤的正樣本的個數(shù)占正樣本的個數(shù)的比例流译。

FNR = \frac{FN}{TP+FN}

假正率(False Positive Rate, FPR):分類錯誤的負樣本個數(shù)占整個負樣本個數(shù)的比例。

FPR = \frac{FP}{FP+TN}

真負率(True Negative Rate, TNR):分類正確的負樣本的個數(shù)占負樣本的個數(shù)的比例者疤。

TNR = \frac{TN}{FP+TN}


ROC曲線是以假正率(FP_rate)和真正率(TP_rate)為軸的曲線福澡,ROC曲線下面的面積我們叫做AUC。
AUC(Area Under Curve) 被定義為ROC曲線下的面積驹马,顯然這個面積的數(shù)值不會大于1革砸。
如下圖所示:

ROC-AUC

曲線與FP_rate軸圍成的面積(記作AUC)越大除秀,說明性能越好,即圖上L2曲線對應的性能優(yōu)于曲線L1對應的性能算利。即:曲線越靠近A點(左上方)性能越好册踩,曲線越靠近B點(右下方)曲線性能越差。

PR(precision recall)曲線

表現(xiàn)的是precision和recall之間的關(guān)系笔时。

回歸評估指標

測試數(shù)據(jù)集中的點棍好,距離模型的平均距離越小,該模型越精確允耿。

使用平均距離借笙,而不是所有測試樣本的距離和,因為距離和受樣本數(shù)量的影響

平均絕對誤差 MAE

平均絕對誤差MAE(Mean Absolute Error)又被稱為 范數(shù)損失(l1-norm loss)较锡。

MSE = \frac{1}{m}\sum_{i=1}^{m}\left | y^{i}-\bar{y} \right|

平均平方誤差 MSE

平均平方誤差 MSE(Mean Squared Error)又被稱為 范數(shù)損失(l2-norm loss)业稼。

MSE = \frac{1}{m}\sum_{i=1}^{m}\left ( y^{i}-\bar{y} \right )^2

RMSE:均方根誤差

均方根誤差RMSE(Root Mean Squared Error)
RMSE = \sqrt{\frac{1}{m}\sum_{i=1}^{m}\left ( y^{i}-\bar{y} \right )^2}

RMSE和MAE有局限性:同一個算法模型,解決不同的問題蚂蕴,不能體現(xiàn)此模型針對不同問題所表現(xiàn)的優(yōu)劣低散。因為不同實際應用中,數(shù)據(jù)的量綱不同骡楼,無法直接比較預測值熔号,因此無法判斷模型更適合預測哪個問題。

R-squared

  • 原始數(shù)據(jù)和均值之差的平方和
    SS_{tot} = \frac{1}{m}\sum_{i=1}^{m}\left ( y^{i}-\bar{y} \right )^2

  • 預測數(shù)據(jù)與原始數(shù)據(jù)均值之差的平方和
    SS_{res} = \sum_{i=1}^{m}(y^i-f(x^i))^2

R^2 = 1 - \frac{SS_{res}}{SS_{tot}}

上面公式中SS_{tot}表示測試數(shù)據(jù)真實值的方差(內(nèi)部差異)鸟整;SS_{res}代表回歸值與真實值之間的平方差異(回歸差異)引镊,因此R-squared既考量了回歸值與真實值的差異,也兼顧了問題本身真實值的變動篮条〉芡罚【模型對樣本數(shù)據(jù)的擬合度】

R-squared 取值范圍(-\infty, 1],值越大表示模型越擬合訓練數(shù)據(jù);最優(yōu)解是1;當模型 預測為隨機值的時候涉茧,有可能為負;若預測值恒為樣本期望赴恨,R2為0。

from sklearn.metrics import mean_squared_error #均方誤差
from sklearn.metrics import mean_absolute_error #平方絕對誤差
from sklearn.metrics import r2_score#R square

聚類性能指標

ARI (Adjusted Rand index)

若樣本數(shù)據(jù)本身帶有正確的類別信息伴栓,可用ARI指標進行評估伦连。

from sklearn.metrics import adjusted_rand_score()

輪廓系數(shù) Silhouette Cofficient

若樣本數(shù)據(jù)沒有所屬類別,可用輪廓系數(shù)來度量聚類結(jié)果的質(zhì)量钳垮。

from sklearn.metrics import silhouette_score

sklearn里的常見評測指標

Scoring(得分) Function(函數(shù)) Comment(注解)
Classification(分類)
‘a(chǎn)ccuracy’ metrics.accuracy_score
‘a(chǎn)verage_precision’ metrics.average_precision_score
‘f1’ metrics.f1_score for binary targets(用于二進制目標)
‘f1_micro’ metrics.f1_score micro-averaged(微平均)
‘f1_macro’ metrics.f1_score macro-averaged(微平均)
‘f1_weighted’ metrics.f1_score weighted average(加權(quán)平均)
‘f1_samples’ metrics.f1_score by multilabel sample(通過 multilabel 樣本)
‘neg_log_loss’ metrics.log_loss requires predict_proba support(需要 predict_proba 支持)
‘precision’ etc. metrics.precision_score suffixes apply as with ‘f1’(后綴適用于 ‘f1’)
‘recall’ etc. metrics.recall_score suffixes apply as with ‘f1’(后綴適用于 ‘f1’)
‘roc_auc’ metrics.roc_auc_score
Clustering(聚類)
‘a(chǎn)djusted_mutual_info_score’ metrics.adjusted_mutual_info_score
‘a(chǎn)djusted_rand_score’ metrics.adjusted_rand_score
‘completeness_score’ metrics.completeness_score
‘fowlkes_mallows_score’ metrics.fowlkes_mallows_score
‘homogeneity_score’ metrics.homogeneity_score
‘mutual_info_score’ metrics.mutual_info_score
‘normalized_mutual_info_score’ metrics.normalized_mutual_info_score
‘v_measure_score’ metrics.v_measure_score
Regression(回歸)
‘explained_variance’ metrics.explained_variance_score
‘neg_mean_absolute_error’ metrics.mean_absolute_error
‘neg_mean_squared_error’ metrics.mean_squared_error
‘neg_mean_squared_log_error’ metrics.mean_squared_log_error
‘neg_median_absolute_error’ metrics.median_absolute_error
‘r2’ metrics.r2_score
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末除师,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子扔枫,更是在濱河造成了極大的恐慌,老刑警劉巖锹安,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件短荐,死亡現(xiàn)場離奇詭異倚舀,居然都是意外死亡,警方通過查閱死者的電腦和手機忍宋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進店門痕貌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人糠排,你說我怎么就攤上這事舵稠。” “怎么了入宦?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵哺徊,是天一觀的道長。 經(jīng)常有香客問我乾闰,道長落追,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任涯肩,我火速辦了婚禮轿钠,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘病苗。我一直安慰自己疗垛,他們只是感情好,可當我...
    茶點故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布硫朦。 她就那樣靜靜地躺著贷腕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪阵幸。 梳的紋絲不亂的頭發(fā)上花履,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天,我揣著相機與錄音挚赊,去河邊找鬼诡壁。 笑死,一個胖子當著我的面吹牛荠割,可吹牛的內(nèi)容都是我干的妹卿。 我是一名探鬼主播,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼蔑鹦,長吁一口氣:“原來是場噩夢啊……” “哼夺克!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起嚎朽,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤铺纽,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后哟忍,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體狡门,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡陷寝,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了其馏。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片凤跑。...
    茶點故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖叛复,靈堂內(nèi)的尸體忽然破棺而出仔引,到底是詐尸還是另有隱情,我是刑警寧澤褐奥,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布咖耘,位于F島的核電站,受9級特大地震影響抖僵,放射性物質(zhì)發(fā)生泄漏鲤看。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一耍群、第九天 我趴在偏房一處隱蔽的房頂上張望义桂。 院中可真熱鬧,春花似錦蹈垢、人聲如沸慷吊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽溉瓶。三九已至,卻和暖如春谤民,著一層夾襖步出監(jiān)牢的瞬間堰酿,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工张足, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留触创,地道東北人。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓为牍,卻偏偏與公主長得像哼绑,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子碉咆,可洞房花燭夜當晚...
    茶點故事閱讀 44,781評論 2 354

推薦閱讀更多精彩內(nèi)容