評(píng)估指標(biāo)

機(jī)器學(xué)習(xí)或者是日常生活中晌纫，遇見的往往是二分類問題比較多，二分類模型的模型評(píng)價(jià)準(zhǔn)則很多夯辖，Auc_score,F1_score蕴茴，accuracy等等都是比較常用的劝评。而針對(duì)多分類問題來說，有些二分類的評(píng)價(jià)準(zhǔn)則就相對(duì)而言不怎么適用了倦淀。雖然可以將多分類問題轉(zhuǎn)化為多個(gè)2vs2問題進(jìn)行討論蒋畜，步驟繁雜的同時(shí)效果也得不到保障。目前在進(jìn)行多模態(tài)的一個(gè)分類研究撞叽，在模型評(píng)價(jià)時(shí)也廢了不少腦筋姻成，所以在這里將看到的比較常用的多分類評(píng)價(jià)準(zhǔn)則進(jìn)行整理，便于日后學(xué)習(xí)能扒。

高偏差(high bias)與方差(high variance)

偏差,可以理解為樣本與模型預(yù)測(cè)結(jié)果的差距佣渴，可以使用平方差計(jì)算

方差是樣本y值與模型期望的差的平方和。

模型對(duì)實(shí)驗(yàn)數(shù)據(jù)欠擬合(underfitting) 是會(huì)出現(xiàn)搞偏差初斑，而過擬合(overfitting)會(huì)造成高方差

解決方法：直接的方法是將實(shí)驗(yàn)數(shù)據(jù)一分為二：訓(xùn)練集和測(cè)試集。模型在訓(xùn)練集和測(cè)試集上都達(dá)到高正確率才說明偏差和方差都可以接受膨处。
增加體征的數(shù)量可以降低偏差见秤；減少特征數(shù)量可以降低方差

二分類和回歸評(píng)估指標(biāo)

image.png

多分類指標(biāo)：

評(píng)價(jià)準(zhǔn)則1：Kappa系數(shù)
Kappa系數(shù)是基于混淆矩陣的計(jì)算得到的模型評(píng)價(jià)參數(shù)。計(jì)算公式如下：

image

系數(shù)的值在-1到1之間真椿，系數(shù)小于0的話實(shí)際上就相當(dāng)于隨機(jī)了鹃答。
python實(shí)現(xiàn)為:


from sklearn.metrics import cohen_kappa_score
kappa = cohen_kappa_score(y_true,y_pred，label=None) #(label除非是你想計(jì)算其中的分類子集的kappa系數(shù)突硝，否則不需要設(shè)置)

2.海明距離
海明距離也適用于多分類的問題测摔，簡(jiǎn)單來說就是衡量預(yù)測(cè)標(biāo)簽與真實(shí)標(biāo)簽之間的距離，取值在0~1之間解恰。距離為0說明預(yù)測(cè)結(jié)果與真實(shí)結(jié)果完全相同锋八，距離為1就說明模型與我們想要的結(jié)果完全就是背道而馳。公式就不貼了（0*0 原諒我太懶）护盈，直接來python實(shí)例挟纱。


from sklearn.metrics import hamming_loss
ham_distance = hamming_loss(y_true,y_pred)

3.杰卡德相似系數(shù)
它與海明距離的不同之處在于分母。當(dāng)預(yù)測(cè)結(jié)果與實(shí)際情況完全相符時(shí)腐宋，系數(shù)為1紊服；當(dāng)預(yù)測(cè)結(jié)果與實(shí)際情況完全不符時(shí)檀轨，系數(shù)為0；當(dāng)預(yù)測(cè)結(jié)果是實(shí)際情況的真子集或真超集時(shí)欺嗤，距離介于0到1之間参萄。
我們可以通過對(duì)所有樣本的預(yù)測(cè)情況求平均得到算法在測(cè)試集上的總體表現(xiàn)情況。

from sklearn.metrics import jaccard_similarity_score
jaccrd_score = jaccrd_similarity_score(y_true,y_pred,normalize = default)
#normalize默認(rèn)為true煎饼，這是計(jì)算的是多個(gè)類別的相似系數(shù)的平均值讹挎，normalize = false時(shí)分別計(jì)算各個(gè)類別的相似系數(shù)

4.鉸鏈損失
鉸鏈損失（Hinge loss）一般用來使“邊緣最大化”（maximal margin）。損失取值在0~1之間腺占，當(dāng)取值為0淤袜，表示多分類模型分類完全準(zhǔn)確，取值為1表明完全不起作用衰伯。

from sklearn.metrics import hinge_loss
hinger = hinger_loss(y_true,y_pred)

最后編輯于：2019.03.18 21:40:43

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末铡羡，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子意鲸，更是在濱河造成了極大的恐慌烦周，老刑警劉巖，帶你破解...
沈念sama閱讀 216,843評(píng)論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件怎顾，死亡現(xiàn)場(chǎng)離奇詭異读慎，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)槐雾，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,538評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門夭委，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人募强，你說我怎么就攤上這事株灸。” “怎么了擎值？”我有些...
開封第一講書人閱讀 163,187評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵慌烧，是天一觀的道長(zhǎng)。經(jīng)常有香客問我鸠儿，道長(zhǎng)屹蚊，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,264評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任进每，我火速辦了婚禮汹粤，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘品追。我一直安慰自己玄括，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,289評(píng)論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布肉瓦。她就那樣靜靜地躺著遭京，像睡著了一般胃惜。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上哪雕，一...
開封第一講書人閱讀 51,231評(píng)論 1贊 299
城市分裂傳說
那天船殉，我揣著相機(jī)與錄音，去河邊找鬼斯嚎。笑死利虫，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的堡僻。我是一名探鬼主播糠惫，決...
沈念sama閱讀 40,116評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼钉疫！你這毒婦竟也來了硼讽？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,945評(píng)論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤牲阁，失蹤者是張志新（化名）和其女友劉穎固阁，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體城菊，經(jīng)...
沈念sama閱讀 45,367評(píng)論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡备燃，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,581評(píng)論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了凌唬。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片并齐。...
茶點(diǎn)故事閱讀 39,754評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖客税，靈堂內(nèi)的尸體忽然破棺而出冀膝，到底是詐尸還是另有隱情，我是刑警寧澤霎挟，帶...
沈念sama閱讀 35,458評(píng)論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站麻掸，受9級(jí)特大地震影響酥夭，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜脊奋，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,068評(píng)論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一熬北、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧诚隙，春花似錦讶隐、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,692評(píng)論 0贊 22
一樁弒父案巫延，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽效五。三九已至，卻和暖如春炉峰，著一層夾襖步出監(jiān)牢的瞬間畏妖，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,842評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國(guó)打工疼阔，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留戒劫，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,797評(píng)論 2贊 369
代替公主和親
正文我出身青樓婆廊，卻偏偏與公主長(zhǎng)得像迅细，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子淘邻，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,654評(píng)論 2贊 354

評(píng)估指標(biāo)

高偏差(high bias)與方差(high variance)

二分類和回歸評(píng)估指標(biāo)

多分類指標(biāo)：

推薦閱讀更多精彩內(nèi)容