在了解U統(tǒng)計量與AUC之間的關(guān)系前收壕,先復(fù)習(xí)一下Mann-Whitney U Test
首先放上AUC在統(tǒng)計上的意義:
隨機選取一個正例和一個負(fù)例蝗锥,分類器給正例的打分大于分類器給負(fù)例的打分的概率
1. Mann-Whitney U Test
Mann-Whitney U Test常常用來判斷兩個群體間的分布是否相同跃洛。在統(tǒng)計學(xué)上,該檢驗的null hypothesis與alternative hypothesis為:
1.1 例子:龜兔賽跑
假設(shè)伊索不滿意龜兔賽跑的結(jié)果终议,他想要一個具有泛性的比賽結(jié)果汇竭。于是他找來了8只烏龜,8只兔子穴张,讓他們同時賽跑细燎,最后的比賽名次為:
兔、兔陆馁、兔找颓、兔、兔叮贩、兔击狮、兔佛析、龜、龜彪蓬、龜寸莫、龜、龜档冬、龜膘茎、龜、龜酷誓、兔披坏。
每只烏龜戰(zhàn)勝的兔子量為:1、1盐数、1棒拂、1、1玫氢、1帚屉、1、1漾峡,則攻旦。
每只兔子戰(zhàn)勝的烏龜量為:8、8生逸、8牢屋、8、8牺陶、8伟阔、8、0掰伸,則皱炉。
則:
更加泛性上來講,U統(tǒng)計量的計算方式如下:
其中代表名次之和狮鸭,代表樣本量合搅。
因為均為排名之和,所以歧蕉,并且灾部,所以
回到龜兔賽跑的例子中,惯退。
解下來我們需要根據(jù)求得的U去決定結(jié)論是否顯著赌髓,,從Mann-Whitney U test臨界值表上可以看到,在的情況下锁蠕。因為夷野,所以我們便可以拒絕零假設(shè),說明兩個組的分布是不同的(均值/中位數(shù)不同)荣倾,所以我們便可以認(rèn)為兔子確實跑的比烏龜快悯搔。
2. Roc面積與Mann-Whitney U統(tǒng)計量
假設(shè)我們的分類器結(jié)果如以下表
總樣本量
預(yù)測為正的樣本
預(yù)測為負(fù)的樣本
在不考慮排名相同的情況下(如上述表),我們預(yù)測的閾值每越過一個樣本:
- 初始為100%舌仍,則沒有預(yù)測為正的樣本妒貌,則TPR與FPR均為0;
- 越過一個樣本铸豁,閾值為95.2 - 98.4的任何數(shù)灌曙,則我們有一個TP(預(yù)測為正的樣本,且該樣本實際為正)节芥,則TPR上升平匈,F(xiàn)PR不變,以此類推
如果越過一個FP(預(yù)測為正的樣本藏古,但實際為負(fù)的樣本),則TPR不變忍燥,F(xiàn)PR上升拧晕。我們將越過FP的數(shù)量,記為梅垄。
所以厂捞,每次越過一個樣本,ROC曲線增加的面積為:
整體ROC曲線下的面積队丝,即為:
下一步我們需要計算靡馁。與上面龜兔賽跑的例子類似,我們可以使用兩種方法計算
通過排名我們可以看到:
每個0超過的1的數(shù)量為:4机久,1臭墨,1,1膘盖,0胧弛,0,0,則。
每個1超過的0的數(shù)量為:8哈肖,8嫂沉,8,7涵卵,7侮措,7规伐,4茵宪,則最冰。
則
泛性的公式如下:
則