《機(jī)器學(xué)習(xí)(周志華)》學(xué)習(xí)筆記(二)

Q:怎樣評(píng)估一個(gè)學(xué)習(xí)算法訓(xùn)練出來(lái)的學(xué)習(xí)器的效果好壞温艇?

評(píng)估學(xué)習(xí)器的基本要求是:

  1. 學(xué)習(xí)器誤差越小越好。對(duì)于分類任務(wù)幔戏,分類錯(cuò)誤的樣本數(shù)占總樣本數(shù)的比率越小越好啼器。對(duì)于回歸預(yù)測(cè)旬渠,預(yù)測(cè)值與真實(shí)值的差越小越好。

  2. 學(xué)習(xí)器泛化能力越強(qiáng)越好端壳。也就是說(shuō)學(xué)習(xí)能力不僅在訓(xùn)練樣本上要表現(xiàn)好告丢,在新的樣本上的表現(xiàn)也要好。不能像書(shū)呆子一樣在學(xué)校表現(xiàn)很好损谦,但一進(jìn)入社會(huì)就一塌糊涂岖免。

因此岳颇,評(píng)估一個(gè)學(xué)習(xí)器,我們通常首先要衡量它的泛化誤差颅湘,也就是一個(gè)訓(xùn)練好的學(xué)習(xí)器在新樣本上的誤差表現(xiàn)话侧。

Q:當(dāng)只有一個(gè)數(shù)據(jù)集,并且既要訓(xùn)練闯参,又要測(cè)試的時(shí)候瞻鹏,怎么辦?

可以想象人類學(xué)生的做法鹿寨。當(dāng)人類學(xué)生準(zhǔn)備高考新博、或者考研、或者其他考試的時(shí)候脚草,刷題總是必不可少的學(xué)習(xí)過(guò)程赫悄。當(dāng)我們只有一套試卷的時(shí)候,我們總是用一部分試卷來(lái)學(xué)習(xí)(也就是一邊做題馏慨,一邊翻書(shū)埂淮,通過(guò)做題來(lái)梳理知識(shí)和查缺補(bǔ)漏),然后另外一部分試卷用來(lái)真正地測(cè)試自己的能力(全程做題熏纯,做完再對(duì)答案)同诫。機(jī)器學(xué)習(xí)的做法也一樣粤策。

留出法:當(dāng)只有一個(gè)數(shù)據(jù)集的時(shí)候樟澜,用一部分來(lái)訓(xùn)練,一部分來(lái)測(cè)試叮盘。而且訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)沒(méi)有交集秩贰。通常會(huì)用60%到80%的數(shù)據(jù)作為訓(xùn)練集,剩下的作為測(cè)試集柔吼。需要注意的是毒费,在選擇訓(xùn)練集(或者測(cè)試集)的時(shí)候要采用分層抽樣的方法。就像刷題一樣愈魏,訓(xùn)練集和測(cè)試集都要有相近比例的題型觅玻,不能訓(xùn)練集全是選擇題,測(cè)試集全是論述題培漏,應(yīng)該訓(xùn)練集和測(cè)試集都包含選擇題和測(cè)試題溪厘,而且比例要一致,都是八成選擇題牌柄,兩成論述題畸悬。

一次的訓(xùn)練-測(cè)試結(jié)果可能不夠科學(xué),最好劃分不同的訓(xùn)練集和測(cè)試集珊佣,做多次訓(xùn)練-測(cè)試蹋宦,將測(cè)試結(jié)果(錯(cuò)誤率披粟、查準(zhǔn)率之類的)取平均。

交叉檢驗(yàn)法:這是在“留出法”的基礎(chǔ)上改進(jìn)的方法冷冗。先將數(shù)據(jù)集分為k個(gè)大小相似的互斥子集(當(dāng)然守屉,每個(gè)子集的產(chǎn)生都要用分層抽樣進(jìn)行)。每次用k-1個(gè)子集作為訓(xùn)練集蒿辙,剩下的一個(gè)作為測(cè)試集胸梆。這樣就可以進(jìn)行k次訓(xùn)練-測(cè)試。k的測(cè)試結(jié)果的平均值就是最終的測(cè)試結(jié)果须板。

自助法:上述兩種方法都是在原本作為訓(xùn)練集的數(shù)據(jù)中抽出一部分作為測(cè)試集碰镜,因此訓(xùn)練集的規(guī)模不可避免地減少了,訓(xùn)練效果也就受到了影響习瑰。自助法則是一種比較好的緩解方法绪颖。假設(shè)有一個(gè)包含m個(gè)樣本的數(shù)據(jù)集D。對(duì)這個(gè)數(shù)據(jù)集進(jìn)行m次有放回的抽樣甜奄,則得到了一個(gè)含有m個(gè)樣本的數(shù)據(jù)集D'柠横。D'相對(duì)于原數(shù)據(jù)集D,規(guī)模沒(méi)有減少课兄,只是D'中有部分樣本是重復(fù)出現(xiàn)的牍氛。所以在抽樣中沒(méi)有抽到的樣本就作為測(cè)試集,D'就作為訓(xùn)練集烟阐。按照概率論推導(dǎo)可知搬俊,一般來(lái)說(shuō)抽樣中國(guó)會(huì)有三分之一的樣本沒(méi)有被抽到,也就是說(shuō)測(cè)試集大小為數(shù)據(jù)集D大小的三分之一蜒茄。

雖然自助法能彌補(bǔ)留出法和交叉檢驗(yàn)法的不足唉擂,但是也有自己的缺陷,那就是改變了原來(lái)的訓(xùn)練樣本的分布檀葛,這也會(huì)對(duì)訓(xùn)練效果造成影響玩祟。因此在數(shù)據(jù)集比較大時(shí)多采用留出法和交叉檢驗(yàn)法,當(dāng)數(shù)據(jù)集比較小時(shí)采用自助法屿聋。

Q:在測(cè)試一個(gè)學(xué)習(xí)器時(shí)空扎,有哪些測(cè)試指標(biāo)可以使用?

錯(cuò)誤率(error):最常用的測(cè)試指標(biāo)就是錯(cuò)誤率润讥。對(duì)于一次分類任務(wù)转锈,如果分類錯(cuò)誤的樣本數(shù)為a,總樣本數(shù)為m象对,則錯(cuò)誤率E=a/m.(精度為1-a/m)黑忱。比如為100個(gè)西瓜分類,有10個(gè)分錯(cuò)了,錯(cuò)誤率就是10%甫煞。

均方誤差(mean squared error):“錯(cuò)誤率”一般針對(duì)分類任務(wù)菇曲,回歸預(yù)測(cè)則用均方誤差,即各次抚吠,預(yù)測(cè)值與真實(shí)值常潮,的差,的平方楷力,的和:\sum_{i=1}^n (y_預(yù) - y_真)^2可以認(rèn)為是各次預(yù)測(cè)的誤差的累加喊式。

查準(zhǔn)率(precision):也就是檢索出來(lái)的結(jié)果中準(zhǔn)確的結(jié)果所占的比例。比如找出100個(gè)西瓜中的好瓜萧朝,找出50個(gè)岔留,但這50個(gè)中只有40個(gè)是真正的好瓜,則查準(zhǔn)率為80%检柬。

查全率(recall):也就是希望檢索的結(jié)果中被檢索出來(lái)的比例献联。比如找出100個(gè)西瓜中的好瓜,找出40個(gè)何址,但真正的好瓜有50個(gè)里逆,則查全率為80%。

ROC曲線:很多二分類學(xué)習(xí)器的分類方法是計(jì)算出每一個(gè)樣本作為正例的概率用爪,然后按照概率大小對(duì)樣本排序原押,最后確定一個(gè)臨界概率(閾值),大于臨界概率的認(rèn)定為正例偎血,其余為反例诸衔。以西瓜分類為例。有些西瓜是好瓜的概率高烁巫,有些西瓜是好瓜的概率低署隘。把這些西瓜按照概率排序宠能,然后取50%作為臨界概率亚隙。概率大于50%的認(rèn)為是好瓜,否則為壞瓜违崇。因此這個(gè)排序的質(zhì)量很重要阿弃。

使用這種方法就會(huì)產(chǎn)生兩個(gè)指標(biāo):真正例率(“選出的好瓜”中真正的好瓜占所有的好瓜的比例,也就是好瓜的查準(zhǔn)率)羞延,和假正例率(“選出的好瓜”中壞瓜占所有壞瓜的比例)渣淳。對(duì)于每一個(gè)臨界概率,都有一個(gè)對(duì)應(yīng)的真正例率和假正例率伴箩。把各個(gè)臨界概率對(duì)應(yīng)的真正例率和假正例率繪成圖就是ROC圖入愧。

AUC

AUC:Area Under Curve 就是ROC曲線中右下方區(qū)域的面積。AUC判斷一個(gè)分類用的排序隊(duì)列的好壞,AUC越大越好棺蛛。

Q:知道了兩個(gè)學(xué)習(xí)器的某個(gè)指標(biāo)怔蚌,比如錯(cuò)誤率,A學(xué)習(xí)器的錯(cuò)誤率低于B學(xué)習(xí)器的錯(cuò)誤率旁赊,能否認(rèn)為A學(xué)習(xí)器質(zhì)量比B學(xué)習(xí)器好桦踊?

不能。

首先一次的測(cè)試結(jié)果可能有誤差终畅,需要多次測(cè)試然后取平均籍胯。所以應(yīng)該比較平均錯(cuò)誤率。其次一個(gè)學(xué)習(xí)器的平均錯(cuò)誤率比另一個(gè)的低离福,這個(gè)是否顯著杖狼?若某一次評(píng)估中A學(xué)習(xí)器的平均錯(cuò)誤率是2%,B學(xué)習(xí)器的平均錯(cuò)誤率是2.001%妖爷,能否就能說(shuō)明A的性能比B好本刽?

若要比較兩個(gè)學(xué)習(xí)器的某項(xiàng)指標(biāo),要用到統(tǒng)計(jì)學(xué)的假設(shè)檢驗(yàn)赠涮,才能得到有顯著性的子寓,盡可能排除偶然性的結(jié)論。比如用t檢驗(yàn)比較兩個(gè)學(xué)習(xí)器的平均錯(cuò)誤率笋除,用方差分析和多重比較來(lái)比較多個(gè)學(xué)習(xí)器的某項(xiàng)性能斜友。


本作品首發(fā)于簡(jiǎn)書(shū)博客園平臺(tái),采用知識(shí)共享署名 4.0 國(guó)際許可協(xié)議進(jìn)行許可垃它。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末鲜屏,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子国拇,更是在濱河造成了極大的恐慌洛史,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件酱吝,死亡現(xiàn)場(chǎng)離奇詭異也殖,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)务热,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門忆嗜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人崎岂,你說(shuō)我怎么就攤上這事捆毫。” “怎么了冲甘?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵绩卤,是天一觀的道長(zhǎng)途样。 經(jīng)常有香客問(wèn)我,道長(zhǎng)濒憋,這世上最難降的妖魔是什么娘纷? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮跋炕,結(jié)果婚禮上赖晶,老公的妹妹穿的比我還像新娘。我一直安慰自己辐烂,他們只是感情好遏插,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著纠修,像睡著了一般胳嘲。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上扣草,一...
    開(kāi)封第一講書(shū)人閱讀 49,749評(píng)論 1 289
  • 那天了牛,我揣著相機(jī)與錄音,去河邊找鬼辰妙。 笑死鹰祸,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的密浑。 我是一名探鬼主播蛙婴,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼尔破!你這毒婦竟也來(lái)了街图?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤懒构,失蹤者是張志新(化名)和其女友劉穎餐济,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體胆剧,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡絮姆,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了赞赖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片滚朵。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖前域,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情韵吨,我是刑警寧澤匿垄,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響椿疗,放射性物質(zhì)發(fā)生泄漏漏峰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一届榄、第九天 我趴在偏房一處隱蔽的房頂上張望浅乔。 院中可真熱鬧,春花似錦铝条、人聲如沸靖苇。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)贤壁。三九已至,卻和暖如春埠忘,著一層夾襖步出監(jiān)牢的瞬間脾拆,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工莹妒, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留名船,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓旨怠,卻偏偏與公主長(zhǎng)得像包帚,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子运吓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容