AUC與ROC

分類任務(wù)不同于回歸坐搔,本次記錄一下分類任務(wù)中常用的評價指標AUC與ROC

混淆矩陣

在搞清楚ROC和AUC之前帆竹,需要先弄明白混淆矩陣
混淆矩陣中有著Positive、Negative、True孝偎、False的概念,其意義如下:
○ 稱預測類別為1的為Positive(陽性)凉敲,預測類別為0的為Negative(陰性)衣盾。
○ 預測正確的為True(真),預測錯誤的為False(偽)爷抓。
那么就產(chǎn)生了如下的混淆矩陣:


  • 那么混淆矩陣能干什么呢势决?
    1、真陽率(也就是正類被預測為正類占所有正類樣本的比例

    2蓝撇、偽陽率(也就是負類被預測為負類占所有負類樣本的比例

AUC與ROC

  • ROC:
    ROC的橫軸代表FPRate果复,縱軸是TPRate,當二者相等時渤昌,如下圖


其實也就是 y=x直線虽抄,其含義為將正類預測正確的概率=將負類預測正確的概率=0.5,那么就容易看出來独柑,我們期望該條線盡量往左上方偏迈窟,也就是盡量讓正類預測正確的概率大一些,如下面的圖:


  • AUC:
    AUC是ROC下方的面積忌栅。從上面分析來看车酣,ROC的極限是正樣本都被預測正確,也就是TPRate=1,此時的AUC=1骇径,所以躯肌,一般情況下,AUC的值都是小于1的破衔,他代表了一個正樣本被預測為正類的 概率值 比一個負樣本預測為正樣本的概率值 要大的可能性清女。也就是說,任意一個樣本x晰筛,都對應(yīng)著有一個判定為正樣本的概率P嫡丙。

  • 舉例說明:
    對于下面的八個樣本的預測情況:



    可以得到相應(yīng)的混淆矩陣:



    進而計算得到:TPRate=3/4,F(xiàn)PRate=2/4读第,得到ROC曲線如下:

    因此可以計算面積得到AUC=0.625

    對于一些以概率值為預測值的模型來說曙博,其預測值為下圖樣式:



    那么此時我們所選取一個閾值,例如>=0.5怜瞒,就將其預測值設(shè)置為1父泳,這個時候該閾值的選取將影響最終的AUC。

AUC的優(yōu)勢:

AUC的計算方法同時考慮了分類器對于正例和負例的分類能力吴汪,在樣本不平衡的情況下惠窄,依然能夠?qū)Ψ诸惼髯鞒龊侠淼脑u價。因此AUC的目的就是用于平衡準確率與召回率漾橙。

例如在反欺詐場景杆融,設(shè)非欺詐類樣本為正例,負例占比很少(假設(shè)0.1%)霜运,如果使用準確率評估脾歇,把所有的樣本預測為正例便可以獲得99.9%的準確率。
但是如果使用AUC淘捡,把所有樣本預測為正例藕各,TPRate和FPRate同時為1,AUC僅為0.5案淋,成功規(guī)避了樣本不均勻帶來的問題座韵。

轉(zhuǎn)載注明:http://www.reibang.com/p/cb2ec4ff10eb

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市踢京,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌宦棺,老刑警劉巖瓣距,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異代咸,居然都是意外死亡蹈丸,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來逻杖,“玉大人奋岁,你說我怎么就攤上這事≥┌伲” “怎么了闻伶?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長够话。 經(jīng)常有香客問我蓝翰,道長,這世上最難降的妖魔是什么女嘲? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任畜份,我火速辦了婚禮,結(jié)果婚禮上欣尼,老公的妹妹穿的比我還像新娘爆雹。我一直安慰自己,他們只是感情好愕鼓,可當我...
    茶點故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布钙态。 她就那樣靜靜地躺著,像睡著了一般拒啰。 火紅的嫁衣襯著肌膚如雪驯绎。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天谋旦,我揣著相機與錄音剩失,去河邊找鬼。 笑死册着,一個胖子當著我的面吹牛拴孤,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播甲捏,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼演熟,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了司顿?” 一聲冷哼從身側(cè)響起芒粹,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎大溜,沒想到半個月后化漆,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡钦奋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年座云,在試婚紗的時候發(fā)現(xiàn)自己被綠了疙赠。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡朦拖,死狀恐怖圃阳,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情璧帝,我是刑警寧澤捍岳,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布,位于F島的核電站裸弦,受9級特大地震影響祟同,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜理疙,卻給世界環(huán)境...
    茶點故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一晕城、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧窖贤,春花似錦砖顷、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至授嘀,卻和暖如春物咳,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蹄皱。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工览闰, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人巷折。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓压鉴,卻偏偏與公主長得像,于是被迫代替她去往敵國和親锻拘。 傳聞我的和親對象是個殘疾皇子油吭,可洞房花燭夜當晚...
    茶點故事閱讀 43,724評論 2 351

推薦閱讀更多精彩內(nèi)容