ROC放钦、Precision色徘、Recall、TPR操禀、FPR理解

首先褂策,有如下預(yù)備知識(shí)需要清楚,即分類(lèi)的四個(gè)基本屬性颓屑,而其他相關(guān)指標(biāo)均是通過(guò)該四項(xiàng)屬性進(jìn)行組合計(jì)算得出的斤寂。

1. TP、TN揪惦、FP遍搞、FN

- Relevant NonRelevant
Retrieved true positives (tp) false positives(fp)
Not Retrieved false negatives(fn) true negatives (tn)

2. TPR、FPR

其中器腋,

TPR = TP / (TP+FN);

表示當(dāng)前分到正樣本中真實(shí)的正樣本所占所有正樣本的比例溪猿;

FPR = FP / (FP + TN);

表示當(dāng)前被錯(cuò)誤分到正樣本類(lèi)別中真實(shí)的負(fù)樣本所占所有負(fù)樣本總數(shù)的比例;

3. Precision纫塌、Recall诊县、F-Score

其中常見(jiàn)的Precision 和 Recall 定義如下:


Precision Definition

Recall Definition

實(shí)際上:
Recall = TPR,即當(dāng)前被分到正樣本類(lèi)別中措左,真實(shí)的正樣本占所有正樣本的比例翎冲,即召回率(召回了多少正樣本比例)个初;
Precision就是當(dāng)前劃分到正樣本類(lèi)別中拆火,被正確分類(lèi)的比例(即正式正樣本所占比例),就是我們一般理解意義上所關(guān)心的正樣本的分類(lèi)準(zhǔn)確率脸狸;

雖然PrecisionRecall 的值我們預(yù)期是越高越好钳枕,但是這兩個(gè)值在某些場(chǎng)景下卻是存在互斥的缴渊,比如僅僅取一個(gè)樣本,并且這個(gè)樣本也確實(shí)是正樣本鱼炒,那么Precision = 1.0衔沼, 然而 Recall 可能就會(huì)比較低(在該樣本集中可能存在多個(gè)樣本);相反昔瞧,如果取所有樣本指蚁,那么Recall = 1.0,而Precision就會(huì)很低了自晰。所以在這個(gè)意義上凝化,該兩處值需要有一定的約束變量來(lái)控制。

F-Score就是 Precision和 Recall的加權(quán)調(diào)和平均:

F-Score Definition

其中酬荞,當(dāng) α = 1時(shí)搓劫,則 F-Score 即為F1:


F1-Score Definition

當(dāng)然 F1 綜合了 PrecisionRecall 的結(jié)果瞧哟,因此當(dāng) F1/F-Score 較高時(shí),說(shuō)明結(jié)果較為理想枪向。

4. ROC curve

有了如上的預(yù)備知識(shí)勤揩,現(xiàn)在來(lái)看ROC curve就比較容易了。關(guān)于ROC的由來(lái)秘蛔,以及相關(guān)概念這里就不在贅述陨亡,網(wǎng)上資料特別多,但是關(guān)鍵在于理解其中重要的相關(guān)概念深员。ROC是用來(lái)形象展現(xiàn)二分類(lèi)的效果的数苫。先看一個(gè)栗子:


ROC Curve

十分清晰,對(duì)于ROC來(lái)說(shuō)辨液,橫坐標(biāo)就是FPR虐急,而縱坐標(biāo)就是TPR,因此可以想見(jiàn)滔迈,當(dāng) TPR越大止吁,而FPR越小時(shí),說(shuō)明分類(lèi)結(jié)果是較好的燎悍。因此充分說(shuō)明ROC用于二分類(lèi)器描述的優(yōu)勢(shì)敬惦,但是除此之外,有一個(gè)新的問(wèn)題:
ROC曲線(xiàn)并不能完美的表征二分類(lèi)器的分類(lèi)性能谈山,那么如何評(píng)價(jià)俄删?

5. AUC

AUC 即ROC曲線(xiàn)下的面積,計(jì)算方式即為ROC Curve的微積分值奏路,其物理意義可以表示為:隨機(jī)給定一正一負(fù)兩個(gè)樣本畴椰,將正樣本排在負(fù)樣本之前的概率,因此AUC越大鸽粉,說(shuō)明正樣本越有可能被排在負(fù)樣本之前斜脂,即分類(lèi)額結(jié)果越好。
除了計(jì)算積分面積之外触机,還能如何計(jì)算AUC呢帚戳?
1)ROC Curve 面積計(jì)算法;
2)根據(jù)物理意義:對(duì)于所有的二元組合儡首,假設(shè)樣本集合包含 M個(gè)正樣本片任、N個(gè)負(fù)樣本,那么二元組即有 M* N個(gè)蔬胯,對(duì)于M* N個(gè)根據(jù)各自的Score計(jì)算所有的正樣本是否排在負(fù)樣本之前对供,正確的技術(shù)所占比例即為AUC;

6. ROC Curve 繪制

ROC本質(zhì)上就是在設(shè)定某一閾值之后笔宿,計(jì)算出該閾值對(duì)應(yīng)的TPR & FPR犁钟,便可以繪制出ROC上對(duì)應(yīng)的一個(gè)點(diǎn),當(dāng)設(shè)定若干個(gè)閾值之后泼橘,便可以連成ROC曲線(xiàn)涝动,因此可以想見(jiàn),當(dāng)所采樣的閾值越多炬灭,ROC Curve越平滑醋粟。

7. ROC的相關(guān)總結(jié)

  • 1) ROC 可以反映二分類(lèi)器的總體分類(lèi)性能,但是無(wú)法直接從圖中識(shí)別出分類(lèi)最好的閾值重归,事實(shí)上最好的閾值也是視具體的場(chǎng)景所定米愿;
  • 2)ROC Curve 對(duì)應(yīng)的AUC越大(或者說(shuō)對(duì)于連續(xù)凸函數(shù)的ROC曲線(xiàn)越接近(0,1) )說(shuō)明分類(lèi)性能越好;
  • 3)ROC曲線(xiàn)一定是需要在 y = x之上的,否則就是一個(gè)不理想的分類(lèi)器鼻吮;

以上為ROC相關(guān)理解育苟,如有問(wèn)題請(qǐng)指出,謝謝椎木。
CSDN同步發(fā)布:CSDN同步發(fā)布

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末违柏,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子香椎,更是在濱河造成了極大的恐慌漱竖,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件畜伐,死亡現(xiàn)場(chǎng)離奇詭異馍惹,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)玛界,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)万矾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人慎框,你說(shuō)我怎么就攤上這事勤众。” “怎么了鲤脏?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵们颜,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我猎醇,道長(zhǎng)窥突,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任硫嘶,我火速辦了婚禮阻问,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘沦疾。我一直安慰自己称近,他們只是感情好第队,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著刨秆,像睡著了一般凳谦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上衡未,一...
    開(kāi)封第一講書(shū)人閱讀 48,954評(píng)論 1 283
  • 那天尸执,我揣著相機(jī)與錄音,去河邊找鬼缓醋。 笑死如失,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的送粱。 我是一名探鬼主播褪贵,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼抗俄!你這毒婦竟也來(lái)了竭鞍?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤橄镜,失蹤者是張志新(化名)和其女友劉穎偎快,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體洽胶,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡晒夹,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了姊氓。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丐怯。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖翔横,靈堂內(nèi)的尸體忽然破棺而出读跷,到底是詐尸還是另有隱情,我是刑警寧澤禾唁,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布效览,位于F島的核電站,受9級(jí)特大地震影響荡短,放射性物質(zhì)發(fā)生泄漏丐枉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一掘托、第九天 我趴在偏房一處隱蔽的房頂上張望瘦锹。 院中可真熱鬧,春花似錦、人聲如沸弯院。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)听绳。三九已至颂碘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間辫红,已是汗流浹背凭涂。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工祝辣, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留贴妻,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓蝙斜,卻偏偏與公主長(zhǎng)得像名惩,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子孕荠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容